ترخيص بيانات الصور والفيديو الجاهزة

مجموعات بيانات التعرف على الوجه الجاهزة لتدريب نماذج الذكاء الاصطناعي

الاستفادة من مجموعات البيانات المتنوعة ديموغرافيًا والمستمدة من مصادر أخلاقية لتسريع تدريب نموذج الذكاء الاصطناعي والحد من التحيز لشركة تكنولوجيا عالمية رائدة.

مجموعات بيانات التعرف على الوجه الجاهزة

نظرة عامة على المشروع

سعى العميل إلى تسريع تطوير التعرف على الوجه باستخدام الذكاء الاصطناعي دون الخضوع لدورات جمع بيانات طويلة ومكلفة. ولتحقيق ذلك، احتاجوا إلى مجموعات البيانات الجاهزة للاستخدام والتي لم تكن فقط كبيرة ومتنوعة، لكن أيضا مصادر أخلاقية ومتوافقة مع لوائح خصوصية البيانات العالمية.

قدّم شايب مجموعات بيانات شاملة مع تنويعات مُتحكّم بها في الإضاءة، ووضعيات الرأس، والانسدادات، والانفعالات، مما مكّن نماذج العميل من تحقيق الدقة والإنصاف مع استيفاء المعايير العرقية والديموغرافية المطلوبة. تضمّنت كل مجموعة بيانات بيانات وصفية مُفصّلة، وتعليقات توضيحية على الوضعيات، ومربعات تحديد للتعرف على الانفعالات، مما سمح بتدريب النماذج واختبارها في سيناريوهات واقعية شديدة التنوع.

مجموعات بيانات التعرف على الوجه الجاهزة

إحصائيات أساسية

7,000+ موضوعًا
في مجموعة البيانات التاريخية
مع أكثر من 300,000 صورة
و2,000 مقطع فيديو.

10,000+ موضوعًا
في مجموعة بيانات العاطفة متعددة الزوايا.

صور 74,880
في الإضاءة
مجموعة بيانات التباين.

صور 18,600
تغطية ستة
العواطف الأساسية.

نطاق المشروع

العميل المطلوب مجموعات بيانات صور ومقاطع فيديو للوجوه واسعة النطاق، ذات مصادر أخلاقية، ومتنوعة ديموغرافيًا لدعم تطوير وتدريب نماذج التعرف على الوجه. كانت هذه المجموعات من البيانات ضرورية لدعم حالات الاستخدام في أنظمة مكافحة الانتحال والتحقق من الهوية ومطابقة الصور وتحليل التعبيرات، مما يضمن أداء الذكاء الاصطناعي القوي وغير المتحيز في التطبيقات الواقعية.

وشمل نطاق المشاركة ما يلي:

  • تقديم مجموعات البيانات المنسقة تم تصميمه لتلبية حالات استخدام التعرف على الوجه مثل مكافحة التزييف والتحقق من الهوية والتعرف على التعبيرات.
  • توفير الصور ومقاطع الفيديو مع التعليقات التوضيحية التفصيلية للتركيبة السكانية، ووضعية الرأس، والانسدادات، ونوع الإضاءة، والعواطف.
  • ضمان التغطية الديموغرافية المتوازنة لتقليل التحيز النظامي في التدريب.
  • الضمان الامتثال والموافقة مع معايير حماية البيانات والخصوصية العالمية.

مساهمات مجموعة البيانات النموذجية:

  • مجموعة البيانات التاريخية (~7,000 موضوع): أكثر من 300,000 صورة و2,000 مقطع فيديو مع اختلافات في الوضعية والإطباق.
  • مجموعة بيانات العاطفة متعددة الزوايا (~10,000 موضوع): 15-20 صورة لكل موضوع عبر الزوايا والحالات العاطفية.
  • مجموعة بيانات العواطف الستة (~3,100 موضوع): 18,600 صورة توضيحية تغطي التعبيرات البشرية الأساسية.
  • مجموعة بيانات تباين الإضاءة (~468 موضوعًا): 74,880 صورة عبر تسعة ظروف إضاءة.

التحديات

عالج المشروع التحديات الرئيسية المشتركة في بناء نماذج الذكاء الاصطناعي القوية:

التحيز في نماذج الذكاء الاصطناعي

منع التمثيل المفرط لأعراق أو أجناس محددة لضمان العدالة.

التباين في العالم الحقيقي

التقاط ظروف الإضاءة وزوايا الوجه والانسدادات وتعبيرات الوجه الطبيعية.

الحجم والجودة

توفير مئات الآلاف من الصور عالية الدقة دون المساس بالتنوع.

التدقيق المطلوب

تلبية متطلبات الخصوصية وحماية البيانات العالمية الصارمة مع موافقة المشارك الكاملة.

الحلول

نفذ شايب نهج منظم لضمان جودة مجموعة البيانات وأهميتها:

  • مجموعات البيانات المتوازنة والمختارة مع تمثيل واسع النطاق حسب العرق والجنس والعمر.
  • القبض أوضاع متعددة الزوايا وتنوعات الإضاءة لمحاكاة الظروف الحقيقية في العالم الحقيقي.
  • وأضاف التعليقات التفصيلية (على سبيل المثال، وضعية الرأس، الانسدادات، العواطف) لإثراء قابلية استخدام مجموعة البيانات.
  • أنشئت بشكل صارم سير عمل مراقبة الجودة والامتثال لضمان المصادر الأخلاقية والالتزام بالخصوصية.

محفظة مجموعة البيانات

بيانات الصوت التركيبة السكانية / التنوع المعايير / المواصفات
مجموعة بيانات تاريخية لصور الوجه والفيديو (حوالي 7,000 موضوع) 7,000 صورة للتسجيل؛ 300,000+ صورة تاريخية؛ 2,000 مقطع فيديو (1 داخلي + 1 خارجي لكل 1,000 مشارك) العرق: أسود (35%)، شرق آسيوي (42%)، جنوب آسيوي (13%)، أبيض (10%)؛ الجنس: 50% ذكر / 50% أنثى؛ العمر: بالغون 18+ (آخر 10 سنوات) مدة الفيديو: 1-2 دقيقة؛ تنوع وضعية الرأس (P1-P7)؛ 5 أنواع من الانسداد (O0-O4)
مجموعة بيانات صور الوجه (حوالي 5,000 موضوع) 35 صورة لكل موضوع؛ 2,500 هندي؛ 1,000 آسيوي؛ 1,500 أسود العمر: 18-60 سنة؛ توزيع متوازن بين الجنسين بدون تجميل؛ خلفيات وملابس متنوعة؛ الحد الأدنى للدقة: 960×1280
مجموعة بيانات عاطفية متعددة الجوانب (حوالي 10,000 موضوع - صيني) 15-20 صورة لكل موضوع؛ الوضعيات: أمامي، يسار، يمين (30°–60°)؛ التعبيرات: ابتسامة، فم مفتوح، حزن، جدية، محايدة العرق: صيني؛ العمر: 18-26؛ الجنس: مناصفة الدقة: 2160×3840 بكسل أو أعلى
مجموعة بيانات العواطف البشرية الستة (حوالي 3,100 موضوع) 6 صور لكل موضوع (تعبيرات مختلفة)؛ 18,600 صورة إجمالية الأعراق: ياباني (9,000)، كوري (2,400)، صيني (2,400)، جنوب شرق آسيا (2,400)، جنوب آسيا (2,400)؛ العمر: 20-65 عامًا تعليقات توضيحية حول مربعات الحدود للعواطف؛ خلفيات عادية؛ لا قبعات أو نظارات أو عوائق
مجموعة بيانات تباين الإضاءة (حوالي 468 شخصًا هنديًا) 160 صورة لكل موضوع؛ المجموع: 74,880 صورة العمر: 20-70؛ 70% ذكور 9 ظروف إضاءة (داخلية، خارجية، إضاءة جانبية، إضاءة خلفية، نيون، إلخ.)
مجموعة بيانات صور الوجه متعددة الأعراق (حوالي 600 موضوع) 3,752 صورة إجمالية الأعراق: أفريقي، شرق أوسطي، أمريكي أصلي، جنوب آسيوي، جنوب شرق آسيوي؛ العمر: 20-70 عامًا -

نتيجة

حقق التعاون تأثيرًا تجاريًا وفنيًا كبيرًا:

  • تحسين دقة النموذج:تحسين الدقة والتذكر لنماذج التعرف على الوجه عبر حالات الاستخدام المتعددة.
  • الحد من التحيز:يؤدي التمثيل الديموغرافي المتوازن إلى تقليل التحيز النظامي في مخرجات الذكاء الاصطناعي.
  • الجداول الزمنية للتطوير المتسارع:تتيح مجموعات البيانات الجاهزة إنشاء نماذج أولية سريعة وتدريب النماذج دون الحاجة إلى جمع بيانات لفترة طويلة.
  • التدقيق المطلوب:جميع مجموعات البيانات تلتزم بمعايير الخصوصية العالمية وتتضمن موافقة المشاركين.

لقد منحتنا مجموعات بيانات شايب المتنوعة، والمستمدة من مصادر أخلاقية، السرعة والجودة والامتثال اللازمين. وبفضل البيانات الجاهزة للاستخدام، سرّعنا تدريب نماذج الذكاء الاصطناعي وخفضنا التحيز النظامي بشكل ملحوظ.

الذهبي 5 نجوم