٣ فبراير ٢٠٢٤

أكثر من 22 مجموعة بيانات مفتوحة المصدر مطلوبة لرؤية الكمبيوتر

تعد خوارزمية الذكاء الاصطناعي جيدة مثل البيانات التي تغذيها بها.

إنه ليس بيانًا جريئًا ولا بيانًا غير تقليدي. كان من الممكن أن يبدو الذكاء الاصطناعي بعيد المنال منذ عقدين من الزمن ، لكن الذكاء الاصطناعي والتعلم الآلي قطعا شوطًا طويلاً حقًا منذ ذلك الحين.

رؤية الحاسوب تساعد أجهزة الكمبيوتر في فهم الملصقات والصور وتفسيرها. عندما تقوم بتدريب جهاز الكمبيوتر الخاص بك باستخدام النوع الصحيح من الصور ، يمكن أن يكتسب القدرة على اكتشاف وفهم وتحديد سمات الوجه المختلفة ، واكتشاف الأمراض ، وقيادة المركبات الذاتية ، وكذلك إنقاذ الأرواح باستخدام مسح الأعضاء متعدد الأبعاد.

من المتوقع أن يصل سوق رؤية الكمبيوتر 144.46 مليار دولار بحلول عام 2028 من 7.04 مليار دولار أمريكي متواضعة في عام 2020 ، ونمو بمعدل نمو سنوي مركب قدره 45.64٪ بين عامي 2021 و 2028.

بعض حالات استخدام رؤية الكمبيوتر هي:

التصوير الطبي
مركبة ذاتية الحكم
التعرف على الوجه والأشياء
تحديد العيب
كشف المشهد

• مجموعة بيانات الصورة إنك تقوم بتغذية وتدريب مهام التعلم الآلي ورؤية الكمبيوتر الخاصة بك أمر بالغ الأهمية لنجاح مشروع الذكاء الاصطناعي الخاص بك. من الصعب جدًا الحصول على مجموعة بيانات عالية الجودة. اعتمادًا على مدى تعقيد مشروعك ، قد يستغرق الأمر ما بين بضعة أيام إلى بضعة أسابيع للحصول على مجموعات بيانات موثوقة وذات صلة لأغراض رؤية الكمبيوتر.

هنا ، نقدم لك مجموعة (مصنفة لراحتك) من مجموعات البيانات مفتوحة المصدر التي يمكنك استخدامها على الفور.

قائمة شاملة بمجموعات بيانات الرؤية الحاسوبية

العام:

IMAGEnet (رابط)
ImageNet هي مجموعة بيانات مستخدمة على نطاق واسع ، وهي تأتي مع 1.2 مليون صورة مذهلة مصنفة في 1000 فئة. تم تنظيم مجموعة البيانات هذه وفقًا للتسلسل الهرمي لـ WorldNet وتصنيفها إلى ثلاثة أجزاء - بيانات التدريب وتسميات الصور وبيانات التحقق من الصحة.
علم الحركة 700 (رابط)
Kinetics 700 عبارة عن مجموعة بيانات ضخمة عالية الجودة تحتوي على أكثر من 650,000 مقطع من 700 فئة مختلفة من فئات الحركة البشرية. يحتوي كل من الإجراءات الجماعية على حوالي 700 مقطع فيديو. تحتوي المقاطع الموجودة في مجموعة البيانات على تفاعلات بشرية وكائن بشري ، والتي ثبت أنها مفيدة جدًا عند التعرف على الأفعال البشرية في مقاطع الفيديو.
سيفار 10 (رابط)
CIFAR 10 هي واحدة من أكبر مجموعات بيانات الرؤية الحاسوبية التي تضم 60000 صورة ملونة 32 × 32 تمثل عشر فئات مختلفة. يحتوي كل فصل على حوالي 6000 صورة تستخدم لتدريب خوارزميات الرؤية الحاسوبية والتعلم الآلي.

التعرف على الوجه:

الوجوه المسمى في البرية (رابط)
Labeled Faced in the Wild هي مجموعة بيانات ضخمة تحتوي على أكثر من 13,230 صورة لما يقرب من 5,750 شخصًا تم اكتشافهم من الإنترنت. تم تصميم مجموعة بيانات الوجوه هذه لتسهيل دراسة اكتشاف الوجه غير المقيد.
كاسيا ويب فيس (رابط)
CASIA Web face عبارة عن مجموعة بيانات جيدة التصميم تساعد في التعلم الآلي والبحث العلمي حول التعرف على الوجه غير المقيد. مع أكثر من 494,000 صورة لما يقرب من 10,000 هوية حقيقية ، فهي مثالية لمهام التعرف على الوجوه والتحقق منها.
مجموعة بيانات وجوه UMD (رابط)
يواجه UMD مجموعة بيانات مشروحة جيدًا تحتوي على جزأين - الصور الثابتة وإطارات الفيديو. تحتوي مجموعة البيانات على أكثر من 367,800 تعليق توضيحي للوجه و 3.7 مليون إطار فيديو مشروح للموضوعات.

التعرف على خط اليد:

قاعدة بيانات MNIST (رابط)
MNIST هي قاعدة بيانات تحتوي على عينات من الأرقام المكتوبة بخط اليد من 0 إلى 9 ، ولديها 60,000 و 10,000 صورة تدريب واختبار. تم إصدار MNIST في 1999 ، وهو يسهل اختبار أنظمة معالجة الصور في Deep Learning.
مجموعة بيانات الشخصيات الاصطناعية (رابط)
مجموعة بيانات الأحرف الاصطناعية ، كما يوحي الاسم ، هي بيانات مُنشأة بشكل مصطنع تصف بنية اللغة الإنجليزية في عشرة أحرف كبيرة. يأتي مع أكثر من 6000 صورة.

دعنا نناقش متطلبات بيانات التدريب على الذكاء الاصطناعي اليوم.

كشف الكائن:

السيدة كوكو (رابط)
MS COCO أو Common Objects in Context عبارة عن مجموعة بيانات لاكتشاف الكائنات ووضع تعليقات عليها.
يحتوي على أكثر من 328,000 صورة مع الكشف عن نقاط المفاتيح والكشف عن الكائنات المتعددة والتعليقات التوضيحية وقناع التجزئة. يأتي مع 80 فئة كائن وخمسة تسميات توضيحية لكل صورة.
LSUN(رابط)
LSUN ، اختصار لفهم المشهد على نطاق واسع ، لديها أكثر من مليون صورة مصنفة في 20 كائنًا و 10 فئات للمشاهد. تحتوي بعض الفئات على ما يقرب من 300,000 صورة ، مع 300 صورة خاصة للتحقق من الصحة و 1000 صورة لبيانات الاختبار.
كائنات المنزل(رابط)
تحتوي مجموعة بيانات Home Objects على صور مشروحة لكائنات عشوائية من جميع أنحاء المنزل - المطبخ وغرفة المعيشة والحمام. تحتوي مجموعة البيانات هذه أيضًا على عدد قليل من مقاطع الفيديو المشروحة و 398 صورة غير مشروحة مصممة للاختبار.

السيارات:

مجموعة بيانات سيتي سكيب (رابط)
Cityscape هي مجموعة البيانات التي يجب الانتقال إليها عند البحث عن تسلسلات فيديو متنوعة مسجلة من العديد من مشاهد الشوارع في العديد من الاستشهادات. تم التقاط هذه الصور على مدى فترة طويلة وفي ظروف جوية وضوء مختلفة. التعليقات التوضيحية مخصصة لـ 30 فئة من الصور مقسمة إلى ثماني فئات مختلفة.
باركلي ديب درايف (رابط)
تم تصميم Barkley DeepDrive خصيصًا للتدريب على المركبات المستقلة ، ويحتوي على أكثر من 100 ألف تسلسل فيديو مشروح. إنها واحدة من أكثر بيانات التدريب المفيدة للمركبات ذاتية القيادة من خلال ظروف الطريق والقيادة المتغيرة.
القيقب (رابط)
يحتوي Mapillary على أكثر من 750 مليون منظر للشوارع وإشارات المرور في جميع أنحاء العالم ، وهو أمر مفيد للغاية في تدريب نماذج الإدراك البصري في التعلم الآلي وخوارزميات الذكاء الاصطناعي. يتيح لك تطوير مركبات مستقلة تلبي مختلف ظروف الإضاءة والطقس ووجهات النظر.

التصوير الطبي:

مجموعة بيانات Covid-19 Open Research (رابط)
تحتوي مجموعة البيانات الأصلية هذه على حوالي 6500 قطعة رئة متعددة الأضلاع حول الأشعة السينية على الصدر AP / PA. بالإضافة إلى ذلك ، تتوفر 517 صورة لأشعة سينية لمرضى Covid-19 مع علامات تحتوي على الاسم والموقع وتفاصيل القبول والنتيجة والمزيد.
قاعدة بيانات المعاهد الوطنية للصحة لـ 100,000،XNUMX أشعة سينية للصدر (رابط)
تعد قاعدة بيانات المعاهد الوطنية للصحة واحدة من أكثر مجموعات البيانات المتاحة للجمهور شمولاً والتي تحتوي على 100,000 صورة أشعة سينية للصدر والبيانات ذات الصلة المفيدة للمجتمع العلمي والبحثي. حتى أنه يحتوي على صور لمرضى يعانون من أمراض رئوية متقدمة.
أطلس علم الأمراض الرقمي (رابط)
يقدم Atlas of Digital Pathology عدة صور رقعة نسيجية مرضية ، أكثر من 17,000 في المجموع ، من ما يقرب من 100 شريحة مشروحة لأعضاء مختلفة. تعد مجموعة البيانات هذه مفيدة في تطوير رؤية الكمبيوتر وبرمجيات التعرف على الأنماط.

التعرف على المشهد:

التعرف على المشهد الداخلي (رابط)
التعرف على المشهد الداخلي عبارة عن مجموعة بيانات مصنفة للغاية تحتوي على ما يقرب من 15620 صورة للأشياء والمناظر الداخلية لاستخدامها في التعلم الآلي والتدريب على البيانات. يأتي مع أكثر من 65 فئة ، ولكل فئة ما لا يقل عن 100 صورة.
xView (رابط)
باعتبارها واحدة من أشهر مجموعات البيانات المتاحة للجمهور ، تحتوي xView على الكثير من الصور العلوية المشروحة من العديد من المشاهد المعقدة والكبيرة. نظرًا لوجود حوالي 60 فئة وأكثر من مليون مثيل كائن ، فإن الغرض من مجموعة البيانات هذه هو توفير إغاثة أفضل للكوارث باستخدام صور القمر الصناعي.
وجهات (رابط)
الأماكن ، مجموعة بيانات ساهم بها معهد ماساتشوستس للتكنولوجيا ، لديها أكثر من 1.8 مليون صورة من 365 فئة مشهد مختلفة. هناك حوالي 50 صورة في كل فئة من هذه الفئات للتحقق من صحتها و 900 صورة للاختبار. من الممكن تعلم ميزات المشهد العميق لإنشاء التعرف على المشهد أو مهام التعرف المرئي.

الترفيه:

مجموعة بيانات IMDB WIKI (رابط)
IMDB - Wiki هي واحدة من أكثر قواعد البيانات العامة شيوعًا للوجوه المصنفة بشكل مناسب مع العمر والجنس والأسماء. كما أن لديها حوالي 20 ألف وجه من المشاهير و 62 ألفًا من ويكيبيديا.
وجوه المشاهير (رابط)
Celeb Faces عبارة عن قاعدة بيانات واسعة النطاق تحتوي على 200,000 صورة مشروحة للمشاهير. تأتي الصور مع ضوضاء في الخلفية وتغيرات في الوضع ، مما يجعلها ذات قيمة لتدريب مجموعات الاختبار في مهام رؤية الكمبيوتر. إنه مفيد للغاية لتحقيق دقة أعلى في التعرف على الوجه ، والتحرير ، وتوطين أجزاء الوجه ، والمزيد.

الآن بعد أن أصبح لديك قائمة ضخمة من مجموعات بيانات الصور مفتوحة المصدر لتزويد آلات الذكاء الاصطناعي الخاصة بك بالطاقة. تعتمد نتائج نماذج الذكاء الاصطناعي والتعلم الآلي بشكل أساسي على جودة مجموعات البيانات التي تغذيها وتدربها عليها. إذا كنت تريد أن يقدم نموذج الذكاء الاصطناعي الخاص بك تنبؤات دقيقة ، فإنه يحتاج إلى مجموعات بيانات عالية الجودة يتم تجميعها ووضع علامات عليها وتسميتها إلى حد الكمال. لتضخيم نجاح نظام رؤية الكمبيوتر الخاص بك ، يجب عليك استخدام قواعد بيانات صور عالية الجودة ذات صلة برؤية مشروعك. إذا كنت تبحث عن المزيد من مجموعات البيانات هذه انقر هنا لمعرفة ذلك

شارك الاجتماعية

تحدث إلى خبير

الاسم الأول*
اسم العائلة*
البريد إلكتروني:*
الهاتف:*
الشركة*
الدولة*
الدولة
التعليقات*
بالتسجيل ، أنا أتفق مع Shaip سياسة الخصوصية و شروط الخدمة وأقدم موافقتي على تلقي اتصالات تسويقية B2B من Shaip.
CAPTCHA

تنزيل كتاب مجاني

قد يعجبك أيضاً

أكثر من 22 مجموعة بيانات مفتوحة المصدر مطلوبة لرؤية الكمبيوتر

قائمة شاملة بمجموعات بيانات الرؤية الحاسوبية

العام:

IMAGEnet (رابط)

علم الحركة 700 (رابط)

سيفار 10 (رابط)

التعرف على الوجه:

الوجوه المسمى في البرية (رابط)

كاسيا ويب فيس (رابط)

مجموعة بيانات وجوه UMD (رابط)

التعرف على خط اليد:

قاعدة بيانات MNIST (رابط)

مجموعة بيانات الشخصيات الاصطناعية (رابط)

كشف الكائن:

السيدة كوكو (رابط)

LSUN(رابط)

كائنات المنزل(رابط)

السيارات:

مجموعة بيانات سيتي سكيب (رابط)

باركلي ديب درايف (رابط)

القيقب (رابط)

التصوير الطبي:

مجموعة بيانات Covid-19 Open Research (رابط)

قاعدة بيانات المعاهد الوطنية للصحة لـ 100,000،XNUMX أشعة سينية للصدر (رابط)

أطلس علم الأمراض الرقمي (رابط)

التعرف على المشهد:

التعرف على المشهد الداخلي (رابط)

xView (رابط)

وجهات (رابط)

الترفيه:

مجموعة بيانات IMDB WIKI (رابط)

وجوه المشاهير (رابط)

شارك الاجتماعية

تحدث إلى خبير

خدمات بيانات الذكاء الاصطناعي

خاصة

صناعة

المنتجات

الشركة

الموارد

تواصل معنا