نيوز تك >> تسريب 12,000 مفتاح API وكلمة مرور: تهديدات أمنية خطيرة في بيانات تدريب الذكاء الاصطناعي

تسريب 12,000 مفتاح API وكلمة مرور: تهديدات أمنية خطيرة في بيانات تدريب الذكاء الاصطناعي

نيوز تك
آخر تحديث : 28/02/2025

شارك

كشفت دراسة حديثة عن وجود ما يزيد عن 12,000 من مفاتيح API وكلمات المرور النشطة داخل مجموعات البيانات العامة المستخدمة في تدريب نماذج اللغة الكبيرة (LLMs). يشير هذا الاكتشاف إلى مخاطر أمنية جسيمة، حيث يمكن أن تؤدي هذه البيانات المكشوفة إلى تعزيز ممارسات ترميز غير آمنة وتعرض الأنظمة للاختراق.

في الآونة الأخيرة، كشف باحثون في الأمن السيبراني عن أكثر من 12,000 مفتاح API وكلمة مرور نشطة تم العثور عليها في مجموعات بيانات عامة تُستخدم في تدريب نماذج الذكاء الاصطناعي. نتيجة لذلك، أثار هذا الاكتشاف مخاوف كبيرة بشأن أمن المعلومات، إذ يمكن للمهاجمين استغلال هذه البيانات لاختراق أنظمة حساسة. بالإضافة إلى ذلك، قد تؤدي هذه التسريبات إلى تعزيز ممارسات برمجية غير آمنة، مما يزيد من مخاطر الهجمات الإلكترونية. لذا، من الضروري فهم أبعاد هذه المشكلة واتخاذ التدابير اللازمة لحماية البيانات.

مصدر التسريب وكيف تم اكتشافه

أجرت Truffle Security تحليلًا شاملاً لأرشيف Common Crawl، الذي يحتوي على بيانات مأخوذة من أكثر من 250 مليار صفحة ويب تم جمعها خلال 18 عامًا. أثناء الفحص، اكتشف الباحثون 219 نوعًا مختلفًا من مفاتيح API وكلمات المرور، شملت:

مفاتيح AWS الجذرية التي تمنح وصولًا مباشرًا للخوادم.
بيانات وصول Slack التي قد تسمح بالتجسس على الاتصالات الداخلية.
مفاتيح Mailchimp API التي يمكن استخدامها في حملات بريد إلكتروني ضارة.

نظرًا لحجم هذا التسريب، أصبح من الواضح أن الشركات بحاجة إلى تحسين إدارة بياناتها لمنع حدوث مثل هذه الانتهاكات في المستقبل.

المخاطر الأمنية المرتبطة بتسريب مفاتيح API

عند تسرب بيانات الاعتماد، يمكن أن تواجه الشركات والمؤسسات تهديدات خطيرة. على سبيل المثال، قد يتمكن المهاجمون من:

الوصول غير المصرح به إلى الأنظمة، مما يسمح لهم بسرقة أو تعديل البيانات الحساسة.
تنفيذ هجمات موسعة باستخدام مفاتيح API المخترقة لنشر البرمجيات الضارة أو شن هجمات تصيد احتيالي.
تسريب المزيد من المعلومات، حيث يمكن للمهاجمين استخراج بيانات إضافية واستغلالها في عمليات اختراق أخرى.

في ظل هذه التهديدات المتزايدة، يصبح من الضروري أن تعتمد المؤسسات سياسات أمنية صارمة لحماية مفاتيح API وكلمات المرور.

كيف تؤثر هذه التسريبات على نماذج الذكاء الاصطناعي؟

تعتمد نماذج الذكاء الاصطناعي الكبيرة على مجموعات بيانات ضخمة أثناء التدريب. ومع ذلك، عندما تحتوي هذه البيانات على مفاتيح API أو كلمات مرور، فقد يتم تضمينها بشكل غير مقصود في استجابات النماذج. على سبيل المثال، إذا طلب أحد المطورين من نموذج ذكاء اصطناعي توليد كود برمجي، فقد يقوم النموذج عن غير قصد بإدراج مفتاح API حقيقي. بالتالي، يؤدي ذلك إلى مخاطر أمنية حقيقية، حيث يمكن استخدام هذه المفاتيح للوصول إلى أنظمة حساسة.

حوادث سابقة مرتبطة بتسريب بيانات الاعتماد

في الواقع، لم يكن هذا الحادث الأول من نوعه. في وقت سابق، كشفت Lasso Security عن أن بعض بيانات الاعتماد المسربة عبر مستودعات GitHub ظلت متاحة من خلال أدوات الذكاء الاصطناعي مثل Microsoft Copilot، حتى بعد جعل المستودعات خاصة. خلال التحقيق، اكتشف الباحثون أكثر من 20,000 مستودع GitHub تحتوي على بيانات حساسة تخص شركات مثل:

Microsoft، التي تضم مشاريع برمجية ضخمة.
Google، التي تمتلك أنظمة تعتمد على البنية السحابية.
Intel، التي تعمل على تطوير معالجات وأنظمة حساسة.

بسبب هذه الحوادث، أصبح من الضروري أن تتخذ المؤسسات تدابير وقائية لمنع تسرب بياناتها الحساسة.

كيفية منع تسرب مفاتيح API؟

لحماية الأنظمة من مخاطر تسريب مفاتيح API، ينبغي على المؤسسات اتباع استراتيجيات فعالة، مثل:

إزالة البيانات الحساسة قبل استخدامها في التدريب
يجب فحص البيانات بدقة قبل استخدامها في نماذج الذكاء الاصطناعي للتأكد من عدم احتوائها على معلومات حساسة.
استخدام أدوات متخصصة للكشف عن البيانات السرية
تتوفر أدوات تحليل شيفرة قادرة على اكتشاف وإزالة المفاتيح السرية قبل نشر الأكواد.
تخزين بيانات الاعتماد بشكل آمن
بدلاً من تضمين مفاتيح API في الأكواد البرمجية، يجب استخدام أنظمة إدارة الأسرار مثل AWS Secrets Manager أو HashiCorp Vault.
تدريب المطورين على ممارسات الأمن السيبراني
يعد وعي المطورين بمخاطر تسريب البيانات أمرًا ضروريًا لضمان التزامهم بأفضل ممارسات الأمان.
تحديد صلاحيات الوصول بذكاء
يجب تقييد صلاحيات مفاتيح API بحيث لا يتم استخدامها إلا للأغراض الضرورية، مما يقلل من المخاطر المحتملة عند تسريبها.

كيف استجابت الشركات لهذه التهديدات؟

لحماية المستخدمين، بدأت العديد من الشركات باتخاذ خطوات لمعالجة هذه المشكلة. على سبيل المثال، أطلقت GitHub ميزات جديدة تهدف إلى:

الكشف التلقائي عن مفاتيح API المسربة عند تحميل الأكواد.
إخطار أصحاب المستودعات فورًا عند اكتشاف بيانات حساسة.
اقتراح حلول أمان للمطورين لتقليل المخاطر المرتبطة باستخدام مفاتيح الوصول.

بفضل هذه الإجراءات، أصبح بإمكان الشركات تحسين أمان بياناتها وتقليل احتمالات التسريب.

أهمية تعزيز الأمن الرقمي لمنع التسريبات المستقبلية

في النهاية، يُظهر هذا التسريب مدى خطورة الإهمال في إدارة مفاتيح API وكلمات المرور. مع توسع الاعتماد على الذكاء الاصطناعي، تصبح الحاجة إلى تعزيز الأمن الرقمي أكثر أهمية من أي وقت مضى. لذلك، يجب على الشركات والمطورين اتباع ممارسات صارمة لحماية بياناتهم، واستخدام الأدوات المناسبة لمنع تسرب المعلومات الحساسة. من خلال التحسين المستمر لإجراءات الأمان، يمكن تقليل المخاطر وضمان بيئة رقمية أكثر أمانًا للجميع.