تعد خوارزمية الذكاء الاصطناعي جيدة مثل البيانات التي تغذيها بها.
إنه ليس بيانًا جريئًا ولا بيانًا غير تقليدي. كان من الممكن أن يبدو الذكاء الاصطناعي بعيد المنال منذ عقدين من الزمن ، لكن الذكاء الاصطناعي والتعلم الآلي قطعا شوطًا طويلاً حقًا منذ ذلك الحين.
رؤية الحاسوب يساعد الكمبيوتر على فهم وتفسير العلامات والصور. عندما تدرب الكمبيوتر باستخدام النوع الصحيح من مجموعات بيانات الصور، فإنه يستطيع اكتساب القدرة على اكتشاف وفهم وتحديد ملامح الوجه المختلفة، واكتشاف الأمراض، وقيادة المركبات ذاتية القيادة، وإنقاذ الأرواح باستخدام مسح الأعضاء متعدد الأبعاد.
من المتوقع أن يصل سوق رؤية الكمبيوتر 144.46 مليار دولار بحلول عام 2028 من 7.04 مليار دولار أمريكي متواضعة في عام 2020 ، ونمو بمعدل نمو سنوي مركب قدره 45.64٪ بين عامي 2021 و 2028.
إنّ مجموعة بيانات الصورة إنك تقوم بتغذية وتدريب مهام التعلم الآلي ورؤية الكمبيوتر الخاصة بك أمر بالغ الأهمية لنجاح مشروع الذكاء الاصطناعي الخاص بك. من الصعب جدًا الحصول على مجموعة بيانات عالية الجودة. اعتمادًا على مدى تعقيد مشروعك ، قد يستغرق الأمر ما بين بضعة أيام إلى بضعة أسابيع للحصول على مجموعات بيانات موثوقة وذات صلة لأغراض رؤية الكمبيوتر.
هنا، نقدم لك مجموعة (مصنفة لتناسب راحتك) من مجموعات بيانات الصور مفتوحة المصدر التي يمكنك استخدامها على الفور.
قائمة شاملة لمجموعات بيانات الصور لتدريب نموذج الرؤية الحاسوبية الخاص بك
العام:
IMAGEnet
ImageNet هي مجموعة بيانات مستخدمة على نطاق واسع ، وهي تأتي مع 1.2 مليون صورة مذهلة مصنفة في 1000 فئة. تم تنظيم مجموعة البيانات هذه وفقًا للتسلسل الهرمي لـ WorldNet وتصنيفها إلى ثلاثة أجزاء - بيانات التدريب وتسميات الصور وبيانات التحقق من الصحة.
علم الحركة 700
Kinetics 700 عبارة عن مجموعة بيانات ضخمة عالية الجودة تحتوي على أكثر من 650,000 مقطع من 700 فئة مختلفة من فئات الحركة البشرية. يحتوي كل من الإجراءات الجماعية على حوالي 700 مقطع فيديو. تحتوي المقاطع الموجودة في مجموعة البيانات على تفاعلات بشرية وكائن بشري ، والتي ثبت أنها مفيدة جدًا عند التعرف على الأفعال البشرية في مقاطع الفيديو.
سيفار 10
CIFAR 10 هي واحدة من أكبر مجموعات بيانات الرؤية الحاسوبية التي تضم 60000 صورة ملونة 32 × 32 تمثل عشر فئات مختلفة. يحتوي كل فصل على حوالي 6000 صورة تستخدم لتدريب خوارزميات الرؤية الحاسوبية والتعلم الآلي.
مجموعة بيانات صور الحيوانات الأليفة لـ Oxford-IIIT
تتضمن مجموعة بيانات صور الحيوانات الأليفة 37 فئة تحتوي كل فئة على 200 صورة. وتختلف هذه الصور من حيث الحجم والوضع والإضاءة، كما أنها مصحوبة بتعليقات توضيحية للسلالة ومنطقة الاهتمام بالرأس وتقسيم الخريطة على مستوى البكسل.
صور جوجل المفتوحة
مع ما يصل إلى 9 ملايين عنوان URL، تعد هذه واحدة من أكبر مجموعات بيانات الصور في القائمة، حيث تحتوي على ملايين الصور المصنفة عبر 6,000 فئة.
صور النباتات
تتضمن هذه المجموعة مجموعات بيانات صور متعددة تضم ما يصل إلى مليون صورة نباتية، تغطي ما يقرب من 1 نوعًا.
التعرف على الوجه:
الوجوه المسمى في البرية
Labeled Faced in the Wild هي مجموعة بيانات ضخمة تحتوي على أكثر من 13,230 صورة لما يقرب من 5,750 شخصًا تم اكتشافهم من الإنترنت. تم تصميم مجموعة بيانات الوجوه هذه لتسهيل دراسة اكتشاف الوجه غير المقيد.
كاسيا ويب فيس
CASIA Web face عبارة عن مجموعة بيانات جيدة التصميم تساعد في التعلم الآلي والبحث العلمي حول التعرف على الوجه غير المقيد. مع أكثر من 494,000 صورة لما يقرب من 10,000 هوية حقيقية ، فهي مثالية لمهام التعرف على الوجوه والتحقق منها.
مجموعة بيانات وجوه UMD
يواجه UMD مجموعة بيانات مشروحة جيدًا تحتوي على جزأين - الصور الثابتة وإطارات الفيديو. تحتوي مجموعة البيانات على أكثر من 367,800 تعليق توضيحي للوجه و 3.7 مليون إطار فيديو مشروح للموضوعات.
كشف قناع الوجه
تتضمن مجموعة البيانات هذه 853 صورة مقسمة إلى ثلاث فئات: "مع قناع"، و"بدون قناع"، و"قناع تم ارتداؤه بشكل غير صحيح"، بالإضافة إلى المربعات المحيطة بها بتنسيق PASCAL VOC.
فيريت
FERET (قاعدة بيانات تكنولوجيا التعرف على الوجه) عبارة عن مجموعة بيانات صور شاملة تحتوي على أكثر من 14,000 صورة توضيحية لوجوه بشرية.
التعرف على خط اليد:
قاعدة بيانات MNIST
MNIST هي قاعدة بيانات تحتوي على عينات من الأرقام المكتوبة بخط اليد من 0 إلى 9 ، ولديها 60,000 و 10,000 صورة تدريب واختبار. تم إصدار MNIST في 1999 ، وهو يسهل اختبار أنظمة معالجة الصور في Deep Learning.
مجموعة بيانات الشخصيات الاصطناعية
مجموعة بيانات الأحرف الاصطناعية ، كما يوحي الاسم ، هي بيانات مُنشأة بشكل مصطنع تصف بنية اللغة الإنجليزية في عشرة أحرف كبيرة. يأتي مع أكثر من 6000 صورة.
كشف الكائن:
السيدة كوكو
MS COCO أو Common Objects in Context عبارة عن مجموعة بيانات لاكتشاف الكائنات ووضع تعليقات عليها.
يحتوي على أكثر من 328,000 صورة مع الكشف عن نقاط المفاتيح والكشف عن الكائنات المتعددة والتعليقات التوضيحية وقناع التجزئة. يأتي مع 80 فئة كائن وخمسة تسميات توضيحية لكل صورة.
LSUN
LSUN ، اختصار لفهم المشهد على نطاق واسع ، لديها أكثر من مليون صورة مصنفة في 20 كائنًا و 10 فئات للمشاهد. تحتوي بعض الفئات على ما يقرب من 300,000 صورة ، مع 300 صورة خاصة للتحقق من الصحة و 1000 صورة لبيانات الاختبار.
كائنات المنزل
تحتوي مجموعة بيانات Home Objects على صور مشروحة لكائنات عشوائية من جميع أنحاء المنزل - المطبخ وغرفة المعيشة والحمام. تحتوي مجموعة البيانات هذه أيضًا على عدد قليل من مقاطع الفيديو المشروحة و 398 صورة غير مشروحة مصممة للاختبار.
السيارات:
مجموعة بيانات سيتي سكيب
Cityscape هي مجموعة البيانات التي يجب الانتقال إليها عند البحث عن تسلسلات فيديو متنوعة مسجلة من العديد من مشاهد الشوارع في العديد من الاستشهادات. تم التقاط هذه الصور على مدى فترة طويلة وفي ظروف جوية وضوء مختلفة. التعليقات التوضيحية مخصصة لـ 30 فئة من الصور مقسمة إلى ثماني فئات مختلفة.
باركلي ديب درايف
تم تصميم Barkley DeepDrive خصيصًا للتدريب على المركبات المستقلة ، ويحتوي على أكثر من 100 ألف تسلسل فيديو مشروح. إنها واحدة من أكثر بيانات التدريب المفيدة للمركبات ذاتية القيادة من خلال ظروف الطريق والقيادة المتغيرة.
القيقب
يحتوي Mapillary على أكثر من 750 مليون منظر للشوارع وإشارات المرور في جميع أنحاء العالم ، وهو أمر مفيد للغاية في تدريب نماذج الإدراك البصري في التعلم الآلي وخوارزميات الذكاء الاصطناعي. يتيح لك تطوير مركبات مستقلة تلبي مختلف ظروف الإضاءة والطقس ووجهات النظر.
التصوير الطبي:
مجموعة بيانات Covid-19 Open Research
تحتوي مجموعة البيانات الأصلية هذه على حوالي 6500 قطعة رئة متعددة الأضلاع حول الأشعة السينية على الصدر AP / PA. بالإضافة إلى ذلك ، تتوفر 517 صورة لأشعة سينية لمرضى Covid-19 مع علامات تحتوي على الاسم والموقع وتفاصيل القبول والنتيجة والمزيد.
قاعدة بيانات المعاهد الوطنية للصحة لـ 100,000،XNUMX أشعة سينية للصدر
تعد قاعدة بيانات المعاهد الوطنية للصحة واحدة من أكثر مجموعات البيانات المتاحة للجمهور شمولاً والتي تحتوي على 100,000 صورة أشعة سينية للصدر والبيانات ذات الصلة المفيدة للمجتمع العلمي والبحثي. حتى أنه يحتوي على صور لمرضى يعانون من أمراض رئوية متقدمة.
أطلس علم الأمراض الرقمي
يقدم Atlas of Digital Pathology عدة صور رقعة نسيجية مرضية ، أكثر من 17,000 في المجموع ، من ما يقرب من 100 شريحة مشروحة لأعضاء مختلفة. تعد مجموعة البيانات هذه مفيدة في تطوير رؤية الكمبيوتر وبرمجيات التعرف على الأنماط.
التعرف على المشهد:
التعرف على المشهد الداخلي
التعرف على المشهد الداخلي عبارة عن مجموعة بيانات مصنفة للغاية تحتوي على ما يقرب من 15620 صورة للأشياء والمناظر الداخلية لاستخدامها في التعلم الآلي والتدريب على البيانات. يأتي مع أكثر من 65 فئة ، ولكل فئة ما لا يقل عن 100 صورة.
xView
باعتبارها واحدة من أشهر مجموعات البيانات المتاحة للجمهور ، تحتوي xView على الكثير من الصور العلوية المشروحة من العديد من المشاهد المعقدة والكبيرة. نظرًا لوجود حوالي 60 فئة وأكثر من مليون مثيل كائن ، فإن الغرض من مجموعة البيانات هذه هو توفير إغاثة أفضل للكوارث باستخدام صور القمر الصناعي.
وجهات
الأماكن ، مجموعة بيانات ساهم بها معهد ماساتشوستس للتكنولوجيا ، لديها أكثر من 1.8 مليون صورة من 365 فئة مشهد مختلفة. هناك حوالي 50 صورة في كل فئة من هذه الفئات للتحقق من صحتها و 900 صورة للاختبار. من الممكن تعلم ميزات المشهد العميق لإنشاء التعرف على المشهد أو مهام التعرف المرئي.
الترفيه:
مجموعة بيانات IMDB WIKI
IMDB - Wiki هي واحدة من أكثر قواعد البيانات العامة شيوعًا للوجوه المصنفة بشكل مناسب مع العمر والجنس والأسماء. كما أن لديها حوالي 20 ألف وجه من المشاهير و 62 ألفًا من ويكيبيديا.
وجوه المشاهير
Celeb Faces عبارة عن قاعدة بيانات واسعة النطاق تحتوي على 200,000 صورة مشروحة للمشاهير. تأتي الصور مع ضوضاء في الخلفية وتغيرات في الوضع ، مما يجعلها ذات قيمة لتدريب مجموعات الاختبار في مهام رؤية الكمبيوتر. إنه مفيد للغاية لتحقيق دقة أعلى في التعرف على الوجه ، والتحرير ، وتوطين أجزاء الوجه ، والمزيد.
الآن بعد أن أصبح لديك قائمة ضخمة من مجموعات بيانات الصور مفتوحة المصدر لتزويد آلات الذكاء الاصطناعي الخاصة بك بالطاقة. تعتمد نتائج نماذج الذكاء الاصطناعي والتعلم الآلي بشكل أساسي على جودة مجموعات البيانات التي تغذيها وتدربها عليها. إذا كنت تريد أن يقدم نموذج الذكاء الاصطناعي الخاص بك تنبؤات دقيقة ، فإنه يحتاج إلى مجموعات بيانات عالية الجودة يتم تجميعها ووضع علامات عليها وتسميتها إلى حد الكمال. لتضخيم نجاح نظام رؤية الكمبيوتر الخاص بك ، يجب عليك استخدام قواعد بيانات صور عالية الجودة ذات صلة برؤية مشروعك. إذا كنت تبحث عن المزيد من مجموعات البيانات هذه انقر هنا لرؤيتهم