Ананімнасці ў сеціве больш няма: ШІ знаходзіць рэальных людзей за хвіліны
Штучны інтэлект цяпер можа раскрываць асобы людзей, якія хаваюцца пад псеўданімамі ў інтэрнэце, за лічаныя хвіліны і ўсяго за некалькі даляраў.

Да такой высновы прыйшлі даследчыкі з Швейцарскай вышэйшай тэхнічнай школы Цюрыха і Anthropic. Навукоўцы паказалі, што сучасныя ШІ-мадэлі здольныя аўтаматычна супастаўляць ананімныя профілі з рэальнымі людзьмі, выкарыстоўваючы толькі тэксты паведамленняў без структураваных даных, накшталт табліц або рэйтынгаў. Калі раней для падобных расследаванняў патрабаваліся гадзіны ручной працы, то цяпер ШІ робіць гэта ў цалкам аўтаматычным рэжыме.
У адным з экспэрыментаў даследчыкі ўзялі 338 карыстальнікаў партала Hacker News, якія раней самі паказвалі спасылкі на свае профілі ў LinkedIn. З апісанняў выдалілі імёны і прамыя спасылкі. Пасля гэтага ШІ-агенту далі толькі безасабовыя тэксты публікацый і даручылі знайсці рэальную асобу ўладальніка акаўнта. Мадэль правільна супаставіла 226 профіляў з 338 пры дакладнасці каля 90%. Іншымі словамі, пераважная большасць спробаў угадаць профіль аказалася правільнай.
Сістэма працуе паэтапна: моўная мадэль аналізуе паведамленні і здабывае з іх прыкметы — прафесію, месца жыхарства, інтарэсы і іншыя дэталі. На аснове гэтых даных фармуецца профіль, які аўтаматычна супастаўляецца з магчымымі кандыдатамі ў адкрытых крыніцах. Затым мадэль правярае найбольш верагодныя супадзенні і ацэньвае ўзровень упэўненасці ў выніку.
Асобна даследчыкі праверылі метад на публічных інтэрв’ю вучоных аб прымяненні ШІ ў іх працы. Нягледзячы на частковую рэдактуру тэкстаў, агент змог усталяваць асобы як мінімум 9 з 33 удзельнікаў з высокай дакладнасцю.
Даследчыкі паказваюць, што праблема заключаецца не ў тым, што ШІ «разумнейшы» за чалавека-расследчыка. Мадэль выкарыстоўвае тыя ж ускосныя прыкметы: згадванні ўніверсітэта, праекта, горада, хобі. Розніца ў хуткасці і кошце, бо тое, што раней патрабавала значных намаганняў і таму ўжывалася рэдка, цяпер можна маштабаваць.
Аўтары папярэджваюць, што гэта змяняе базавыя ўяўленні аб ананімнасці ў інтэрнэце. Па іх словах, «практычная скрытнасць», на якую разлічвалі карыстальнікі — перакананне, што іх тэарэтычна можна раскрыць, але ніхто не стане гэтым займацца — больш не працуе. Магчымыя наступствы прымянення такога інструмента, паказваюць даследчыкі, надзвычай шырокія: ад пераследу актывістаў і журналістаў да масавага таргетыраванага махлярства.
@bajmedia