Pentru context, companiile de securitate cibernetică, cercetătorii în inteligență artificială și firmele de intelligence amenințări tratează astfel de depozite ca fiind esențiale pentru antrenarea modelelor de detectare și pentru înțelegerea modului în care evoluează atacurile. Dar ne-am întrebat: cum ar arăta aceste seturi de date enorme dacă le-am stivui unul peste altul, ca niște hard disk-uri? Și cum s-ar compara cu, să zicem, Turnul Eiffel? Cineva din redacția noastră a întrebat un chatbot AI, iar acesta a greșit complet. Așa că am făcut niște calcule aproximative, „pe spatele unui șervețel”, pentru a afla cât de înalte ar fi aceste bănci de date.
Deoarece vx-underground și VirusTotal au „aproximativ” atât de multe date, „aproximativ” este suficient de bun pentru noi în acest caz. Să presupunem că folosim hard disk-uri interne cu capacitate de 1 terabyte, deoarece acestea sunt proiectate să aibă aceeași dimensiune fizică pentru a încăpea în orice computer. Aceste hard disk-uri standard de 3,5 inci au o înălțime de 1 inch, ceea ce este exact ceea ce ne interesează pentru a le stivui unul peste altul. De asemenea, presupunem că hard disk-urile din acest exemplu au exact 1 terabyte, deși în realitate capacitatea totală utilizabilă a unui hard disk este, de obicei, ceva mai mică.
Folosind un instrument de conversie online, se pare că cei 30 de terabytes de date malware ale vx-underground ar putea umple 30 de hard disk-uri stivuite unul peste altul, ajungând la 30 de inci, adică aproximativ 2,5 picioare (0,76 metri). Pentru referință, acest reporter are 6 picioare (1,83 metri) înălțime. (Vezi vizualul de mai jos – și da, o securitate operațională teribilă, știu.) Cu aceeași logică, cei 31 de petabytes de date trimise de VirusTotal ar umple 31.744 de hard disk-uri, care, stivuite unul peste altul, ar atinge aproximativ 2.645 de picioare (806 metri). Cea mai înaltă clădire din lume, Burj Khalifa din Dubai, este puțin mai înaltă, cu 2.722 de picioare (830 metri). Turnul Eiffel are 1.083 de picioare (330 metri). Prin urmare, VirusTotal are echivalentul a aproximativ două turnuri și jumătate Eiffel de date.
Aceste cifre sunt impresionante, dar ele spun doar o parte din poveste. În spatele acestor stive de hard disk-uri se află ani de muncă, colaborare și, uneori, conflicte legale. vx-underground, de exemplu, este cunoscut pentru colecția sa vastă de cod sursă de malware, inclusiv variante ale unor troieni celebri, ransomware și viruși. VirusTotal, pe de altă parte, este o platformă care permite oricui să încarce fișiere suspecte pentru a fi scanate de zeci de motoare antivirus. Mostrele trimise de utilizatori sunt stocate și analizate, contribuind la o bază de date uriașă care ajută la identificarea noilor amenințări.
Dar de ce este atât de importantă această cantitate de date? În primul rând, pentru că malware-ul evoluează constant. Atacatorii își modifică codul pentru a evita detectarea, iar colecțiile mari de mostre permit cercetătorilor să identifice tipare și să dezvolte metode de detectare mai eficiente. În al doilea rând, inteligența artificială și învățarea automată au nevoie de cantități masive de date pentru a fi antrenate corect. Fără aceste bănci de malware, modelele AI ar fi mult mai puțin precise în identificarea amenințărilor noi.
Pe de altă parte, există și provocări etice și legale. Stocarea și distribuirea de malware poate fi periculoasă dacă nu este gestionată corespunzător. De aceea, organizații precum vx-underground și VirusTotal au politici stricte privind accesul și utilizarea datelor. De exemplu, VirusTotal nu permite descărcarea directă a mostrelor de malware decât pentru parteneri autorizați, iar vx-underground oferă acces doar cercetătorilor verificați.
În concluzie, ceea ce pare o simplă curiozitate – cât de înaltă ar fi o stivă de hard disk-uri cu malware – dezvăluie o realitate fascinantă: lupta împotriva criminalității cibernetice se bazează pe cantități uriașe de date, iar infrastructura necesară pentru a le stoca și analiza este la fel de impresionantă ca și amenințările pe care încearcă să le combată.
De ce este important:
Acest articol ilustrează amploarea colecțiilor de malware și modul în care acestea sunt esențiale pentru securitatea cibernetică modernă. Înțelegerea dimensiunii acestor bănci de date ajută la conștientizarea eforturilor necesare pentru a combate amenințările digitale, de la antrenarea modelelor AI până la dezvoltarea de soluții de detectare. De asemenea, subliniază importanța colaborării între cercetători, companii și platforme precum VirusTotal pentru a menține un ecosistem digital mai sigur.