مفتاح التغلب على عقبات تطوير الذكاء الاصطناعي

بيانات أكثر موثوقية

المُقدّمة

بدأ الذكاء الاصطناعي في التقاط الخيال عندما ظهر Tin Man من فيلم The Wizard of Oz على الشاشة الفضية في عام 1939 ، ولم يكتسب موطئ قدم أكثر ثباتًا في روح العصر منذ ذلك الحين. ومع ذلك ، في التطبيق ، مرت منتجات الذكاء الاصطناعي بدورات انتعاش وكساد منتظمة أعاقت حتى الآن أكثر عمليات التبني تأثيرًا.

خلال فترات الازدهار ، قطع المهندسون والباحثون أشواطا هائلة ، ولكن عندما تفوق تطلعاتهم حتما قدرات الحوسبة المتاحة في ذلك الوقت ، تبع ذلك فترة من السكون. لحسن الحظ ، فإن الزيادة الهائلة في قوة الحوسبة التي تنبأ بها قانون مور في عام 1965 أثبتت في معظمها أنها دقيقة ، ومن الصعب المبالغة في أهمية هذه الزيادة.

عقبات التنمية بالذكاء الاصطناعي
اقرأ الكتاب الإلكتروني: مفتاح التغلب على عقبات تطوير الذكاء الاصطناعي ، أو قم بتنزيل نسخة PDF من الكتاب الإلكتروني.

مفتاح التغلب على عقبات تطوير الذكاء الاصطناعي: بيانات أكثر موثوقية

اليوم ، يمتلك الشخص العادي الآن قوة حوسبية في جيبه تزيد بملايين المرات عن قدرة ناسا على الهبوط على سطح القمر في عام 1969. هذا الجهاز المنتشر في كل مكان والذي يوضح بشكل ملائم وفرة من قوة الحوسبة يلبي أيضًا شرطًا أساسيًا آخر للعصر الذهبي للذكاء الاصطناعي: وفرة من البيانات. وفقًا للرؤى المستمدة من مجموعة Information Overload Research Group ، تم إنشاء 90٪ من بيانات العالم في العامين الماضيين. الآن بعد أن اقترب النمو الهائل في قوة الحوسبة أخيرًا مع نمو نيزكي متساوٍ في توليد البيانات ، تتفجر ابتكارات بيانات الذكاء الاصطناعي لدرجة أن بعض الخبراء يعتقدون أنها ستطلق ثورة صناعية رابعة.

تشير البيانات الواردة من الرابطة الوطنية لرأس المال الاستثماري إلى أن قطاع الذكاء الاصطناعي شهد رقماً قياسياً بقيمة 6.9 مليار دولار في الاستثمار في الربع الأول من عام 2020. ليس من الصعب رؤية إمكانات أدوات الذكاء الاصطناعي لأنه يتم استغلالها بالفعل من حولنا. بعض حالات الاستخدام الأكثر وضوحًا لمنتجات الذكاء الاصطناعي هي محركات التوصية وراء تطبيقاتنا المفضلة مثل Spotify و Netflix. على الرغم من أنه من الممتع اكتشاف فنان جديد للاستماع إليه أو عرض برنامج تلفزيوني جديد لمشاهدة الشراهة ، إلا أن هذه التطبيقات منخفضة المخاطر إلى حد ما. تقوم الخوارزميات الأخرى بتقدير درجات الاختبار - تحدد جزئيًا المكان الذي يتم فيه قبول الطلاب في الكلية - ولا يزال آخرون يدققون في السير الذاتية للمرشحين ، ويقررون المتقدمين الذين يحصلون على وظيفة معينة. يمكن أن يكون لبعض أدوات الذكاء الاصطناعي آثار على الحياة أو الموت ، مثل نموذج الذكاء الاصطناعي الذي يفحص سرطان الثدي (الذي يتفوق على الأطباء).

على الرغم من النمو المطرد في كل من الأمثلة الواقعية لتطوير الذكاء الاصطناعي وعدد الشركات الناشئة التي تتنافس لإنشاء الجيل التالي من الأدوات التحويلية ، لا تزال هناك تحديات أمام التطوير والتنفيذ الفعالين. على وجه الخصوص ، يكون مخرجات الذكاء الاصطناعي دقيقة بقدر ما تسمح به المدخلات ، مما يعني أن الجودة هي الأولوية.

عقبات التنمية بالذكاء الاصطناعي

تحدي جودة البيانات غير المتسقة في حلول الذكاء الاصطناعي

هناك بالفعل كمية لا تصدق من البيانات التي يتم إنشاؤها كل يوم: 2.5 كوينتيليون بايت ، وفقًا لموقع Social Media Today. لكن هذا لا يعني أن الأمر كله يستحق تدريب الخوارزمية الخاصة بك. بعض البيانات غير مكتملة ، وبعضها منخفض الجودة ، والبعض الآخر غير دقيق تمامًا ، لذا فإن استخدام أي من هذه المعلومات المعيبة سيؤدي إلى نفس السمات من ابتكار بيانات الذكاء الاصطناعي (المكلف) الخاص بك. وفقًا لبحث أجرته مؤسسة Gartner ، ستؤدي حوالي 85٪ من مشاريع الذكاء الاصطناعي التي تم إنشاؤها بحلول عام 2022 إلى نتائج غير دقيقة بسبب البيانات المتحيزة أو غير الدقيقة. بينما يمكنك بسهولة تخطي توصية بأغنية لا تناسب ذوقك ، فإن الخوارزميات الأخرى غير الدقيقة تأتي بتكلفة مالية كبيرة وسمعة طيبة.

في عام 2018 ، بدأت أمازون في استخدام أداة توظيف مدعومة بالذكاء الاصطناعي ، في الإنتاج منذ عام 2014 ، وكان لها تحيز قوي لا لبس فيه ضد النساء. اتضح أن نماذج الكمبيوتر التي تقوم عليها الأداة تم تدريبها باستخدام السير الذاتية التي تم تقديمها إلى الشركة على مدى عقد من الزمان. نظرًا لأن معظم المتقدمين للتكنولوجيا كانوا رجالًا (وما زالوا كذلك ، ربما بسبب هذه التكنولوجيا) ، قررت الخوارزمية معاقبة السير الذاتية التي تتضمن "نسائية" في أي مكان - كابتن كرة القدم للسيدات أو مجموعة الأعمال النسائية ، على سبيل المثال. حتى أنها قررت معاقبة المتقدمين من كليتين نسائيتين. تدعي أمازون أن الأداة لم تُستخدم أبدًا كمعيار وحيد لتقييم المرشحين المحتملين ، ومع ذلك نظر القائمون بالتوظيف إلى محرك التوصية عند البحث عن موظفين جدد.

تم إلغاء أداة التوظيف في أمازون في النهاية بعد سنوات من العمل ، لكن الدرس باقٍ ، مما يبرز أهمية جودة البيانات عند تدريب الخوارزميات وأدوات الذكاء الاصطناعي. كيف تبدو البيانات "عالية الجودة"؟ باختصار ، يتحقق من هذه المربعات الخمسة:

1. ذات الصلة

لكي تُعتبر البيانات عالية الجودة ، يجب أن تقدم شيئًا ذا قيمة لعملية صنع القرار. هل هناك علاقة بين وضع المتقدم للوظيفة باعتباره بطل الدولة في القفز بالزانة وأدائه في العمل؟ هذا ممكن ، لكن يبدو أنه بعيد الاحتمال. من خلال التخلص من البيانات غير ذات الصلة ، يمكن للخوارزمية التركيز على فرز المعلومات التي تؤثر بالفعل على النتائج.

2. دقيق

يجب أن تمثل البيانات التي تستخدمها الأفكار التي تختبرها بدقة. إذا لم يكن الأمر كذلك ، فلا يستحق ذلك. على سبيل المثال ، قامت أمازون بتدريب خوارزمية التوظيف الخاصة بها باستخدام 10 سنوات من السير الذاتية للمتقدمين ، ولكن ليس من الواضح ما إذا كانت الشركة قد أكدت المعلومات المقدمة في تلك السير الذاتية أولاً. يوضح البحث الذي أجرته شركة Checkster للتحقق من المراجع أن 78٪ من المتقدمين يكذبون أو يفكرون في الكذب على طلب الوظيفة. إذا كانت الخوارزمية تتخذ قرارات توصية باستخدام المعدل التراكمي للمرشح ، على سبيل المثال ، فمن المستحسن التأكد أولاً من صحة هذه الأرقام. قد تستغرق هذه العملية وقتًا ومالًا ، ولكنها ستؤدي أيضًا بلا شك إلى تحسين دقة نتائجك.

3. منظمة بشكل صحيح وشرحت

في حالة نموذج التوظيف المستند إلى السير الذاتية ، يكون التعليق التوضيحي سهلًا نسبيًا. بمعنى ما ، تأتي السيرة الذاتية مشروحة مسبقًا ، على الرغم من أنه لا شك في وجود استثناءات. يسرد معظم المتقدمين خبرتهم الوظيفية تحت عنوان "الخبرة" والمهارات ذات الصلة ضمن "المهارات". ومع ذلك ، في حالات أخرى ، مثل فحص السرطان ، ستكون البيانات أكثر تنوعًا. قد تأتي المعلومات في شكل تصوير طبي ، أو نتائج الفحص البدني ، أو حتى محادثة بين الطبيب والمريض حول تاريخ صحة الأسرة وحالات السرطان ، من بين أشكال أخرى من البيانات. لكي تساهم هذه المعلومات في خوارزمية كشف دقيقة ، يجب أن يتم تنظيمها وتعليقها بعناية للتأكد من أن نموذج الذكاء الاصطناعي يتعلم إجراء تنبؤات دقيقة بناءً على الاستنتاجات الصحيحة.

4. محدثة

كانت أمازون تحاول إنشاء أداة من شأنها توفير الوقت والمال من خلال إعادة إنتاج نفس قرارات التوظيف التي يتخذها البشر في وقت أقل بكثير. من أجل جعل التوصيات دقيقة قدر الإمكان ، يجب تحديث البيانات. إذا أظهرت شركة ذات مرة تفضيلها للمرشحين الذين لديهم القدرة على إصلاح الآلات الكاتبة ، على سبيل المثال ، فمن المحتمل ألا يكون لهذه التعيينات التاريخية تأثير كبير على ملاءمة المتقدمين للوظائف الحالية لأي نوع من الأدوار. نتيجة لذلك ، سيكون من الحكمة إزالتها.

5. متنوعة بشكل مناسب

اختار مهندسو أمازون تدريب خوارزمية مع مجموعة من المتقدمين كانت غالبيتهم من الذكور. كان هذا القرار خطأً فادحًا ، ولم يكن أقل فظاعة من حقيقة أن هذه كانت السير الذاتية التي كانت متاحة للشركة في ذلك الوقت. يمكن لمهندسي أمازون الدخول في شراكة مع منظمات مرموقة مع مماثلة الوظائف المتاحة التي استقبلت المزيد من المتقدمات للوظائف لتعويض النقص ، أو يمكن أن يكون خفض بشكل مصطنع عدد السير الذاتية للرجال لتتناسب مع عدد النساء والمدربين و وجهت الخوارزمية بتمثيل أكثر دقة للسكان. النقطة المهمة هي تلك البيانات التنوع هو المفتاح ، وما لم يتم بذل جهود متضافرة للقضاء على التحيز في المدخلات ، فإن المخرجات المتحيزة ستفعل تسود.

من الواضح أن البيانات عالية الجودة لا تظهر من العدم. بدلاً من ذلك ، يجب أن يتم تنسيقه بعناية مع وضع النتائج المرجوة في الاعتبار. في مجال الذكاء الاصطناعي ، غالبًا ما يقال إن "القمامة في الداخل تعني التخلص من القمامة". هذا البيان صحيح ، لكنه يقلل إلى حد ما من أهمية الجودة. يمكن للذكاء الاصطناعي معالجة كميات هائلة من المعلومات وتحويلها إلى أي شيء ، من اختيارات الأسهم إلى توصيات التوظيف إلى التشخيصات الطبية. هذه القدرة تفوق بكثير قدرة البشر ، مما يعني أيضًا أنها تضخم النتائج. لا يمكن لأحد المجندين البشريين المتحيزين سوى التغاضي عن الكثير من النساء ، لكن المجند المتحيز للذكاء الاصطناعي يمكن أن يتجاهلهن جميعًا. وبهذا المعنى ، فإن القمامة لا تعني التخلص من القمامة فحسب - بل تعني أن كمية صغيرة من البيانات "المهملة" يمكن أن تتحول إلى مكب نفايات كامل.

التغلب على عقبات تطوير الذكاء الاصطناعي

تتضمن جهود تطوير الذكاء الاصطناعي عقبات كبيرة بغض النظر عن الصناعة التي تجري فيها ، وعملية الانتقال من فكرة مجدية إلى منتج ناجح محفوفة بالصعوبات. بين تحديات الحصول على البيانات الصحيحة والحاجة إلى إخفاء هويتها للامتثال لجميع اللوائح ذات الصلة ، يمكن أن تشعر أن إنشاء خوارزمية وتدريبها هو الجزء السهل.

لمنح مؤسستك كل ميزة ضرورية في محاولة تصميم تطوير ذكاء اصطناعي جديد ورائد ، ستحتاج إلى التفكير في الشراكة مع شركة مثل Shaip. أسس شيتان باريك و Vatsal Ghiya شركة Shaip لمساعدة الشركات على تصميم أنواع الحلول التي يمكن أن تحول الرعاية الصحية في الولايات المتحدة بعد أكثر من 16 عامًا في العمل ، نمت شركتنا لتشمل أكثر من 600 عضو في الفريق ، وعملنا مع المئات من العملاء لتحويل الأفكار الجذابة إلى حلول الذكاء الاصطناعي.

من خلال موظفينا وعملياتنا ومنصتنا التي تعمل لصالح مؤسستك ، يمكنك على الفور إطلاق العنان للمزايا الأربع التالية والارتقاء بمشروعك نحو نهاية ناجحة:

1. القدرة على تحرير علماء البيانات


لا يمكن الالتفاف حول أن عملية تطوير الذكاء الاصطناعي تستغرق وقتًا طويلاً ، ولكن يمكنك دائمًا تحسين الوظائف التي يقضي فريقك معظم الوقت في أدائها. لقد وظفت علماء البيانات لأنهم خبراء في تطوير الخوارزميات المتقدمة ونماذج التعلم الآلي ، لكن البحث يوضح باستمرار أن هؤلاء العمال يقضون 80٪ من وقتهم في البحث عن البيانات التي ستعمل على تشغيل المشروع وتنظيفها وتنظيمها. أفاد أكثر من ثلاثة أرباع (76 ٪) من علماء البيانات أن عمليات جمع البيانات العادية هذه هي أيضًا الأجزاء الأقل تفضيلًا في الوظيفة ، لكن الحاجة إلى بيانات عالية الجودة تترك 20 ٪ فقط من وقتهم للتطوير الفعلي ، وهو العمل الأكثر إثارة للاهتمام والمحفز فكريا للعديد من علماء البيانات. من خلال الحصول على البيانات من خلال بائع خارجي مثل Shaip ، يمكن للشركة أن تسمح لمهندسي البيانات الموهوبين والباهظين بالاستعانة بمصادر خارجية لعملهم كحراس بيانات ، وبدلاً من ذلك يقضون وقتهم في أجزاء من حلول الذكاء الاصطناعي حيث يمكنهم إنتاج أكبر قيمة.

2. القدرة على تحقيق نتائج أفضل

يقرر العديد من قادة تطوير الذكاء الاصطناعي استخدام البيانات مفتوحة المصدر أو التعهيد الجماعي لتقليل النفقات ، ولكن ينتهي هذا القرار دائمًا بتكلفة أكبر على المدى الطويل. تتوفر هذه الأنواع من البيانات بسهولة ، لكنها لا تتطابق مع جودة مجموعات البيانات المنسقة بعناية. بيانات التعهيد الجماعي على وجه الخصوص مليئة بالأخطاء والإغفالات وعدم الدقة ، وبينما يمكن أحيانًا حل هذه المشكلات أثناء عملية التطوير تحت أعين المهندسين الساهرة ، فإن الأمر يتطلب تكرارات إضافية لن تكون ضرورية إذا بدأت بمستوى أعلى - بيانات الجودة من البداية.

الاعتماد على البيانات مفتوحة المصدر هو اختصار شائع آخر يأتي مع مجموعة من المزالق الخاصة به. يعد الافتقار إلى التمايز أحد أكبر المشكلات ، لأن الخوارزمية المدربة باستخدام بيانات مفتوحة المصدر يمكن نسخها بسهولة أكبر من الخوارزمية المبنية على مجموعات البيانات المرخصة. من خلال السير في هذا الطريق ، فإنك تدعو إلى المنافسة من المشاركين الآخرين في المساحة الذين يمكنهم خفض أسعارك والحصول على حصة في السوق في أي وقت. عندما تعتمد على Shaip ، فأنت تصل إلى بيانات عالية الجودة يتم تجميعها بواسطة قوة عاملة مدارة ماهرة ، ويمكننا منحك ترخيصًا حصريًا لمجموعة بيانات مخصصة تمنع المنافسين من إعادة إنشاء حقوق الملكية الفكرية التي اكتسبتها بشق الأنفس بسهولة.

3. الوصول إلى المهنيين ذوي الخبرة

الوصول إلى المهنيين ذوي الخبرة حتى إذا كانت قائمتك الداخلية تضم مهندسين مهرة وعلماء بيانات موهوبين ، يمكن لأدوات الذكاء الاصطناعي الخاصة بك الاستفادة من الحكمة التي تأتي فقط من خلال الخبرة. قاد خبراؤنا المتخصصون العديد من تطبيقات الذكاء الاصطناعي في مجالاتهم وتعلموا دروسًا قيمة على طول الطريق ، وهدفهم الوحيد هو مساعدتك في تحقيق أهدافك.

من خلال تحديد خبراء المجال وتنظيم وتصنيف وتصنيف البيانات نيابة عنك ، فأنت تعلم أن المعلومات المستخدمة لتدريب الخوارزمية الخاصة بك يمكن أن تنتج أفضل النتائج الممكنة. نجري أيضًا ضمانًا منتظمًا للجودة للتأكد من أن البيانات تفي بأعلى المعايير وستعمل على النحو المنشود ليس فقط في المختبر ، ولكن أيضًا في وضع العالم الحقيقي.

4. جدول زمني متسارع للتنمية

لا يحدث تطوير الذكاء الاصطناعي بين عشية وضحاها ، ولكن يمكن أن يحدث بشكل أسرع عندما تشترك مع Shaip. يؤدي جمع البيانات الداخلية والتعليق التوضيحي إلى خلق عنق زجاجة تشغيلي كبير يعيق بقية عملية التطوير. يمنحك العمل مع Shaip إمكانية الوصول الفوري إلى مكتبتنا الواسعة من البيانات الجاهزة للاستخدام ، وسيتمكن خبراؤنا من الحصول على أي نوع من المدخلات الإضافية التي تحتاجها من خلال معرفتنا العميقة بالصناعة وشبكتنا العالمية. بدون عبء تحديد المصادر والتعليقات التوضيحية ، يمكن لفريقك العمل على التطوير الفعلي على الفور ، ويمكن أن يساعد نموذج التدريب لدينا في تحديد الأخطاء المبكرة لتقليل التكرارات اللازمة لتحقيق أهداف الدقة.

إذا لم تكن مستعدًا للاستعانة بمصادر خارجية لجميع جوانب إدارة البيانات الخاصة بك ، فإن Shaip يقدم أيضًا نظامًا أساسيًا قائمًا على السحابة يساعد الفرق على إنتاج أنواع مختلفة من البيانات وتعديلها والتعليق عليها بشكل أكثر كفاءة ، بما في ذلك دعم الصور والفيديو والنصوص والصوت . يتضمن ShaipCloud مجموعة متنوعة من أدوات التحقق من الصحة وسير العمل البديهية ، مثل الحل الحاصل على براءة اختراع لتتبع ومراقبة أعباء العمل ، وأداة النسخ لنسخ التسجيلات الصوتية المعقدة والصعبة ، ومكون مراقبة الجودة لضمان جودة لا هوادة فيها. والأفضل من ذلك كله ، أنه قابل للتطوير ، بحيث يمكن أن ينمو مع زيادة المتطلبات المختلفة لمشروعك.

لقد بدأ عصر الابتكار في الذكاء الاصطناعي للتو ، وسنرى تطورات وابتكارات لا تصدق في السنوات القادمة لديها القدرة على إعادة تشكيل الصناعات بأكملها أو حتى تغيير المجتمع ككل. في Shaip ، نريد استخدام خبرتنا للعمل كقوة تحويلية ، ومساعدة الشركات الأكثر ثورية في العالم على تسخير قوة حلول الذكاء الاصطناعي لتحقيق أهداف طموحة.

لدينا خبرة عميقة في تطبيقات الرعاية الصحية والذكاء الاصطناعي للمحادثة ، ولكن لدينا أيضًا المهارات اللازمة لتدريب النماذج لأي نوع من التطبيقات تقريبًا. لمزيد من المعلومات حول كيفية مساعدة Shaip في نقل مشروعك من الفكرة إلى التنفيذ ، ألق نظرة على الموارد العديدة المتاحة على موقعنا الإلكتروني أو تواصل معنا اليوم.

جدول زمني متسارع للتطوير

دعنا نتحدث

  • بالتسجيل ، أنا أتفق مع Shaip سياسة الخصوصية و شروط الخدمة وأقدم موافقتي على تلقي اتصالات تسويقية B2B من Shaip.