Back to Question Center
0

Chuyên gia Semalt cho biết cách Scraping Dữ liệu Web đã được hợp pháp hoá Với phán quyết của Tòa án

1 answers:

Mặc dù cạo dữ liệu từ các trang web không được phép của chủ sở hữu trang web, một thẩm phán gần đây đã cai trị khác trong một số trường hợp. hiQ Labs gần đây đã đệ trình một vụ kiện chống lại LinkedIn để ngăn chặn họ trích xuất dữ liệu từ các trang LinkedIn.

Nó đã trở thành một cú sốc thô lỗ đối với hầu hết mọi người mà LinkedIn được cho là cung cấp cho người dùng tự do khởi động vào các trang web của mình. hiQ đã sử dụng các thuật toán của nó để phát hiện khi một người sử dụng LinkedIn đang tìm kiếm một công việc dựa trên những thay đổi người sử dụng làm cho hồ sơ công cộng của mình.

Các thuật toán chạy trên dữ liệu được trích ra từ các trang web LinkedIn. Theo dự kiến, LinkedIn không thích và các biện pháp đối phó đã được đưa ra để ngăn chặn hiQ từ việc khai thác dữ liệu thêm - san francisco computer rentals. Ngoài các rào cản kỹ thuật đã được đưa ra, có rất nhiều lời cảnh báo pháp luật đã được ban hành quá.

Việc khởi động không có sự lựa chọn nào khác ngoài việc đưa vấn đề này lên một cách hợp pháp. hiQ phải tìm cách khắc phục pháp luật. Công ty muốn LinkedIn ra lệnh xóa bỏ các rào cản kỹ thuật. hiQ cũng muốn quá trình trích xuất dữ liệu của mình trên LinkedIn được hợp pháp hóa.

May mắn thay cho khởi động, nó có những gì nó muốn. Quyết định ủng hộ hiQ. LinkedIn đã được yêu cầu gỡ bỏ tất cả các biện pháp đối phó cản trở hiQ từ việc cạo các trang web (LinkedIn) và cũng cung cấp cho tay miễn phí hiQ vì hành động này hoàn toàn hợp pháp. Thẩm phán phản đối phán quyết của ông về thực tế rằng những gì hiQ muốn cạo là dữ liệu đã được hiển thị cho quan điểm công cộng.

Thẩm phán đã không chỉ ra lệnh cho bị đơn loại bỏ tất cả các cơ chế phòng ngừa được đưa ra chống lại hiQ, nhưng ông cũng ra lệnh rằng bị can nên từ bỏ các hành vi như vậy trong tương lai.

Xúc tiến dữ liệu trên trang web mở

Mặc dù phán quyết vẫn là lệnh tạm thời, nhưng thật đáng mừng khi biết rằng luật pháp hỗ trợ dữ liệu trên web mở và truy cập miễn phí thông tin trên Internet vì phán quyết này khẳng định rằng. Ngay cả khi quyết định cuối cùng có lợi cho bị đơn, thực tế này đã được thiết lập.

Thẩm phán đã thúc đẩy chính sách này bằng cách tắt tất cả các lập luận của LinkedIn. Trong khi LinkedIn cố gắng xác minh rằng nguyên đơn đã vi phạm quyền riêng tư của mình, thẩm phán đã phản đối điều đó với thực tế là bị đơn cũng đang bán dữ liệu.

Khi cuộc tranh cãi không nắm giữ nước, bên bị đơn cũng tuyên bố rằng hành vi của hiQ là vi phạm nghiêm trọng Luật Gian lận và Lạm dụng Máy tính (CFAA) bởi vì việc khởi động truy cập máy chủ của họ để thu thập dữ liệu bất hợp pháp. Một lần nữa, lập luận đã bị thủng. Nó đã bị bác bỏ bởi vì hiQ chỉ là cạo nội dung trên các trang công cộng, không được bảo vệ.

Thẩm phán đã mô tả trường hợp như một người nào đó bước vào cửa hàng mở trong giờ làm việc. Một người như vậy không thể nói là xâm phạm. Vì vậy, hiQ đã không xâm nhập. Thật thú vị, thẩm phán đã đi xa hơn để giải thích lý do tại sao phán quyết của ông là vì lợi ích công cộng.

Tóm lại, tòa chấp nhận rằng vì lợi ích công cộng nhằm thu thập dữ liệu, trích xuất và phân tích dữ liệu. Vì vậy, nó sẽ là một chính sách bất lợi để khuyến khích bố trí các rào cản đối với luồng thông tin tự do.

Những gì bạn nên học hỏi từ phán quyết

Trong khi bạn không có lý do để trích xuất dữ liệu trực tiếp từ LinkedIn, bạn nên học hỏi từ phán quyết. Tốt hơn là chơi an toàn bằng cách đọc và tôn trọng các robot. tệp txt của tất cả các trang web. Hãy nhớ rằng, phán quyết vẫn là lệnh tạm thời. Nó cuối cùng có thể đi ủng hộ của LinkedIn.

Trong khi phán quyết không ảnh hưởng trực tiếp đến bạn, thì thật vui mừng rằng một tòa án liên bang duy trì chính sách giữ web cho công chúng. Vì vậy, thông tin cần có sẵn và có thể tiếp cận được với những người có thể tìm kiếm và tận dụng nó.

Dữ liệu web rất hữu ích cho tất cả mọi người, đặc biệt là các nhà phân tích truyền thông, các nhà phát triển, các nhà khoa học dữ liệu và một số chuyên gia khác. Như vậy, phán quyết này là một sự phát triển hoan nghênh.

December 22, 2017