Сарапшылар Chatgpt-4o сүзгілерін аралап, Windows активтендіру курстарын алу тәсілін тапты.


Зерттеушілер Tatgpt-4o және GPT-4O мини-жасанды интеллектуалды модельдердегі осалдығын анықтады, бұл интеграцияланған қауіпсіздік сүзгілерін бұзуға және ағымдағы Windows активтендіру құлпын алуға мүмкіндік береді. Мәселе мынада, қоғамдық мәліметтерге оқытылған модельдер көпшілікке курстарды ашуға болатындығына байланысты.
Пайдалану AI жүйелеріндегі әлсіздіктерді анықтау үшін Mozilla Odin (0-ші тергеу желісі) аясында көрсетілді. Бағдарламаға қатысқан сарапшылардың бірі модельге алдады, диалогты болжамсыз ойын ретінде жасады. Негізгі мақсат — ойын тетігі мен HTML кристалына қойылатын талаптардың шынайы сипатын жасыру, осылайша жасырын түрде ашуға кедергі келтіретін сүзгілерді елемеу.



Осалдықты күшейту үшін зерттеуші Интернеттегі қосымша ережелерді диалогтың терезесінде құрды: дұрыс емес жауаптарға тыйым салады және модельдің барлық ойын шарттарына бағынады. Бұл логикалық қақпақ кез-келген адамды стандартты сүзгілерді өткізіп жіберуге мәжбүр етеді, өйткені мәтінмән қауіпсіз болып көрінеді.
Соңғы фраза, мен бас тарттым, активтендіру болып жұмыс істедім, өнімді құлыптан босату үлгісін жасадым, оны ойынның соңғы рет деп санады және құпиялылық саясатын бұзбады.
Қабылдайтын құлыптарға Windows-тың әртүрлі нұсқаларына арналған лицензияланған кодтар кіреді — үйден бизнеске. Құлыптың өзі ерекше болмаса да, бұрын жарияланған, бірақ AI-ді автоматты түрде шығарғанымен, AI-ді автоматты түрде шығару мазмұн фильтрінің архитектурасындағы маңызды тесіктерді көрсетеді.
Қауіпсіздік сарапшылары мұндай әдістер басқа шектеулерді елемеу үшін қолданылуы мүмкін екенін, мысалы, ересектерге арналған мазмұнға арналған сүзгілер, улы сілтемелер немесе жеке мәліметтер. Осалдық, AI модельдерінің дәрменсіздігін көрсетеді, зиянсыз немесе техникалық деп көрсетілген мәтінмәнді дәл түсіндіруге арналған.