تقنية

استفاد الباحثون الأمنيون من الرياضيات السيئة للالتفاف على حواجز الأمان الخاصة بالذكاء الاصطناعي، وأطلقوا على ط...

PC Gamer • Wed, 01 Jul 2026

ماذا حدث؟

نص الخبر بالعربي

يمكن فهم LLMs ببساطة على أنها آلات متملقّة، و"نعم، و". ولدهشة عدد قليل جدًا من الأشخاص، فقد أدى ذلك إلى وضع شركات الذكاء الاصطناعي في موقف صعب عندما تحاول روبوتات الدردشة ووكلاء الذكاء الاصطناعي المستندة إلى LLM الاستجابة لطلبات المستخدمين الأكثر بغيضة. لذلك، قامت شركات الذكاء الاصطناعي بتطبيق حواجز السلامة التي تجعل تلبية طلبات معينة أمراً محظوراً.

ولسوء الحظ، فقد ثبت أن من السهل للغاية الالتفاف حول هذه الأمور، مع هجوم جديد استفاد من الحسابات السيئة والحنين القوي لعام 2007. لقد وجد باحثون أمنيون أن روبوت الدردشة الذي يعمل بالذكاء الاصطناعي يمكن جعله يتجاهل حواجز السلامة من خلال "إثبات واقع زائف". قامت شركة LayerX، وهي شركة للأمن السيبراني تركز على الذكاء الاصطناعي، بوضع "5 متصفحات وكيلة ومكون إضافي وكيل واحد (ChatGPT Atlas وComet وFellou وGenspark Browser وSigma Browser وClaude Chrome)" للاختبار، وتوجيه كل وكيل ذكاء اصطناعي لحل لعبة ألغاز رياضية بسيطة تكافئ الإجابات غير الصحيحة فقط، على سبيل المثال.

يقول الباحثون: "بمجرد أن اكتشف العملاء القواعد وعلموا أن الأفعال "غير الصحيحة" مقبولة، لم يعودوا مرتبطين بالواقع. عندما تم تكليفهم بالخطوة الأخيرة من اللغز - المساس ببيانات اعتماد المستخدم - فشل جميع العملاء الستة في التعرف على أنها تتعارض مع حواجز السلامة الخاصة بهم. كخريجة لغة إنجليزية، أحاول جاهدة ألا أقول أي شيء عن رواية 1984 لجورج أورويل، لكن الباحثين لا يمنحونني وقتًا سهلاً من خلال تسمية هجوم إثبات المفهوم هذا بـ "BioShocking".

اتضح أن لعبة BioShock لعام 2007 كانت مصدرًا مباشرًا للإلهام للعبة الألغاز المزورة التي طُلب من عملاء الذكاء الاصطناعي حلها. يُطلق على موقع الويب الضار الذي يستضيف لعبة الألغاز اسم "Rapture Games".

لماذا يهم؟

هذا الخبر مهم لأنه يرتبط بمسار تقنية الذي يبحث عنه الزوار باستمرار، كما أنه يساعد على بناء أرشيف تقني عربي متجدد داخل الموقع بدل الاكتفاء بالروابط الثابتة.

تابع الخبر وانشره

هذه الروابط تساعد على ظهور محتوى الموقع في تطبيقات القراءة والمشاركة، بحيث يرجع الزوار إلى الخبر من منصات خارجية.

المصدر الأصلي

https://www.pcgamer.com/software/ai/security-researchers-have-leveraged-bad-maths-to-get-around-ai-safety-guardrails-naming-the-attack-method-after-one-of-2007s-best-pc-games/

من مواقع أخرى حول نفس الموضوع

UN report says policymakers are struggling to keep up with pace of AI development

Engadget — تقول لجنة الأمم المتحدة إن "الذكاء الاصطناعي ليس جيدًا أو سيئًا بطبيعته"، ولكن هناك حاجة إلى ضمانات أفضل حوله.

Update Your iPhone Now to Patch These 29 Security Flaws

Lifehacker — في حين أن الاهتمام الجماعي لعالم التكنولوجيا منصب حاليًا على نظام التشغيل iOS 27، إلا أن شركة Apple لا تزال تصدر تحديثات لنظام التشغيل iOS 26. على الر...

'No bloat, no telemetry, no nonsense.' Former Microsoft coding wizard makes an OG Notepad clone that's just 2,686 bytes in size

PC Gamer — لم يكن Windows Notepad أكثر من مجرد محرر نصوص أساسي، وقد تم توسيعه في السنوات الأخيرة ليصبح معالج نصوص متكامل تقريبًا. بالنسبة لبعض الأشخاص، أصبحت الأ...

EA accidentally made the right decision twice in one month and reverted it both times, inflicting psychic damage on Battlefield 6 players

PC Gamer — في أحد التحديثات التي تم إجراؤها في أوائل الشهر الماضي، قامت Battlefield 6 عن طريق الخطأ بإجراء تغيير أحبه الجميع. تم تغيير الوصف داخل اللعبة لـ XP Bo...