التقنيةالمحتوى العربيالرئيسية
تقنية

استفاد الباحثون الأمنيون من الرياضيات السيئة للالتفاف على حواجز الأمان الخاصة بالذكاء الاصطناعي، وأطلقوا على ط...

PC Gamer • Wed, 01 Jul 2026

استفاد الباحثون الأمنيون من الرياضيات السيئة للالتفاف على حواجز الأمان الخاصة بالذكاء الاصطناعي، وأطلقوا على ط...

يمكن فهم LLMs ببساطة على أنها آلات متملقّة، و"نعم، و". ولدهشة عدد قليل جدًا من الأشخاص، فقد أدى ذلك إلى وضع شركات الذكاء الاصطناعي في موقف صعب عندما تحاول روبوتات الدردشة ووكلاء الذكاء الاصطناعي المستندة إلى LLM الاستجابة لطلبات المستخدمين...

ماذا حدث؟

يمكن فهم LLMs ببساطة على أنها آلات متملقّة، و"نعم، و". ولدهشة عدد قليل جدًا من الأشخاص، فقد أدى ذلك إلى وضع شركات الذكاء الاصطناعي في موقف صعب عندما تحاول روبوتات الدردشة ووكلاء الذكاء الاصطناعي المستندة إلى LLM الاستجابة لطلبات المستخدمين...

نص الخبر بالعربي

يمكن فهم LLMs ببساطة على أنها آلات متملقّة، و"نعم، و". ولدهشة عدد قليل جدًا من الأشخاص، فقد أدى ذلك إلى وضع شركات الذكاء الاصطناعي في موقف صعب عندما تحاول روبوتات الدردشة ووكلاء الذكاء الاصطناعي المستندة إلى LLM الاستجابة لطلبات المستخدمين الأكثر بغيضة. لذلك، قامت شركات الذكاء الاصطناعي بتطبيق حواجز السلامة التي تجعل تلبية طلبات معينة أمراً محظوراً.

ولسوء الحظ، فقد ثبت أن من السهل للغاية الالتفاف حول هذه الأمور، مع هجوم جديد استفاد من الحسابات السيئة والحنين القوي لعام 2007. لقد وجد باحثون أمنيون أن روبوت الدردشة الذي يعمل بالذكاء الاصطناعي يمكن جعله يتجاهل حواجز السلامة من خلال "إثبات واقع زائف". قامت شركة LayerX، وهي شركة للأمن السيبراني تركز على الذكاء الاصطناعي، بوضع "5 متصفحات وكيلة ومكون إضافي وكيل واحد (ChatGPT Atlas وComet وFellou وGenspark Browser وSigma Browser وClaude Chrome)" للاختبار، وتوجيه كل وكيل ذكاء اصطناعي لحل لعبة ألغاز رياضية بسيطة تكافئ الإجابات غير الصحيحة فقط، على سبيل المثال.

يقول الباحثون: "بمجرد أن اكتشف العملاء القواعد وعلموا أن الأفعال "غير الصحيحة" مقبولة، لم يعودوا مرتبطين بالواقع. عندما تم تكليفهم بالخطوة الأخيرة من اللغز - المساس ببيانات اعتماد المستخدم - فشل جميع العملاء الستة في التعرف على أنها تتعارض مع حواجز السلامة الخاصة بهم. كخريجة لغة إنجليزية، أحاول جاهدة ألا أقول أي شيء عن رواية 1984 لجورج أورويل، لكن الباحثين لا يمنحونني وقتًا سهلاً من خلال تسمية هجوم إثبات المفهوم هذا بـ "BioShocking".

اتضح أن لعبة BioShock لعام 2007 كانت مصدرًا مباشرًا للإلهام للعبة الألغاز المزورة التي طُلب من عملاء الذكاء الاصطناعي حلها. يُطلق على موقع الويب الضار الذي يستضيف لعبة الألغاز اسم "Rapture Games".

لماذا يهم؟

هذا الخبر مهم لأنه يرتبط بمسار تقنية الذي يبحث عنه الزوار باستمرار، كما أنه يساعد على بناء أرشيف تقني عربي متجدد داخل الموقع بدل الاكتفاء بالروابط الثابتة.

تابع الخبر وانشره

هذه الروابط تساعد على ظهور محتوى الموقع في تطبيقات القراءة والمشاركة، بحيث يرجع الزوار إلى الخبر من منصات خارجية.

المصدر الأصلي

https://www.pcgamer.com/software/ai/security-researchers-have-leveraged-bad-maths-to-get-around-ai-safety-guardrails-naming-the-attack-method-after-one-of-2007s-best-pc-games/

من مواقع أخرى حول نفس الموضوع

Update Your iPhone Now to Patch These 29 Security Flaws

Lifehacker — في حين أن الاهتمام الجماعي لعالم التكنولوجيا منصب حاليًا على نظام التشغيل iOS 27، إلا أن شركة Apple لا تزال تصدر تحديثات لنظام التشغيل iOS 26. على الر...