Back to Question Center
0

Semalt Expert berättar hur Web Data Skrapning Legaliserades Med En Domstolsregelverk

1 answers:

Även om det kan vara olagligt att skrapa data från webbplatser utan uttryckligt tillstånd av webbplatsens ägare har en domare nyligen bestämt sig under vissa omständigheter. hiQ Labs ansökte nyligen en rättegång mot LinkedIn för att förhindra dem från att extrahera data från LinkedIn-sidor.

Det kom som en oförskämd chock för de flesta som LinkedIn fick höra att starta gratis åtkomst till sina webbsidor - companies in cloud computing technology. hiQ använde sina algoritmer för att upptäcka när en LinkedIn-användare letar efter ett jobb baserat på de förändringar som användaren gör till sin / hennes offentliga profil.

Algoritmerna körs på data som extraheras från LinkedIns webbsidor. Som förväntat liknade LinkedIn inte det och motåtgärder infördes för att förhindra hiQ från ytterligare datautvinning. Utöver de tekniska hinder som infördes, utfärdades också starkt formulerade juridiska varningar.

Starten hade inget annat val än att ta upp frågan juridiskt. HiQ var tvungen att söka rättslig prövning. Företaget ville att LinkedIn beställde att ta bort sina tekniska hinder. hiQ ville också att dess datautvinningsprocess på LinkedIn legaliserades.

Lyckligtvis för uppstarten fick den vad den ville ha. Domslutet var till fördel för hiQ. LinkedIn var beordrad att ta bort alla motåtgärder som hindrar HiQ från att skrapa sina (LinkedIn) webbsidor och ge också hiQ fri hand eftersom lagen är helt laglig. Domaren hinged sin dom om det faktum att vad HiQ vill skrapa är data som har visats för allmänhetens syn.

Domaren beställde inte bara svaranden att ta bort all förebyggande mekanism som infördes mot hiQ, men han beställde också att svaranden skulle avstå från sådana handlingar i framtiden.

Främjande av öppen webbdata

Medan härskningen fortfarande är ett tillfälligt förbud är det hjärtvärt att höra att lagen stöder öppen webbdata och fri tillgång till information på Internet, eftersom denna dom bekräftar att. Även om det slutgiltiga beslutet får stöd för svaranden har detta faktum redan upprättats.

Domaren främjade denna politik genom att stänga nästan alla LinkedIns argument. Medan LinkedIn försökte fastställa att käranden bryter mot sin integritet motsatte sig domaren det faktum att svaranden också säljer uppgifterna.

När argumentet inte innehöll vatten uppgav svaranden också att hiQ: s agerande brutit mot lagen om bedrägeri och missbruk (Computer Fraud and Abuse Act, CFAA) eftersom uppstarten åt sina servrar för att skörda data olagligt. Återigen var argumentet punkterat. Det avvisades med motiveringen att hiQ endast skrapade innehåll på de offentliga, icke-skyddade sidorna.

Domaren analogiserade fallet när någon gick in i en öppen butik under öppettiderna. En sådan person kan inte sägas vara förevändande. Så, hiQ var inte intrång. Intressant var att domaren gick vidare för att förklara varför hans dom är i allmänhetens intresse.

I ett nötskal accepterade domstolen att det är av allmänt intresse att tillåta att data krypts, extraheras och analyseras. Så det kommer att vara en skadlig politik för att uppmuntra att placera hinder för informationsflödet.

Vad du borde lära av härskningen

Medan du kanske inte har skäl att extrahera data direkt från LinkedIn, bör du lära dig av det härskande. Det är bättre att spela säkert genom att läsa och respektera robotarna. Txt-fil på alla webbplatser. Kom ihåg att härskningen fortfarande är ett tillfälligt förbud. Det kan så småningom vara till fördel för LinkedIn.

Medan härskningen inte kan påverka dig direkt är det glädjande att en federal domstol upprätthåller politiken att hålla nätet öppet för allmänheten. Så information bör vara tillgänglig och tillgänglig för dem som kan söka och utnyttja den.

Webdata är extremt användbar för alla, särskilt mediaanalytiker, utvecklare, datavetenskapare och några andra yrkesverksamma. Som sådan är härskningen en välkommen utveckling.

December 22, 2017