جمع البيانات من أجل الذكاء الاصطناعي للمحادثة

كيفية التعامل مع جمع البيانات من أجل الذكاء الاصطناعي التحاوري

اليوم ، لدينا بعض الروبوتات الناطقة مثل روبوتات المحادثة والمساعدين الافتراضيين والمزيد في منازلنا وأنظمة السيارات والأجهزة المحمولة وحلول أتمتة المنزل وما إلى ذلك. تستمع هذه الأجهزة بدقة إلى ما نقوله وكيف نقول ونسترجع النتائج أو ننفذ مهام محددة .

وإذا كنت تستخدم مساعدًا مثل Siri أو Alexa، ستدرك أيضًا أنهم أصبحوا أكثر غرابة يومًا بعد يوم. ردودهم بارعة ، يتكلمون ، يتجاهلون ، يردون المجاملات ويتصرفون بشكل إنساني أكثر من بعض الزملاء الذين قد تعرفهم. نحن لا نمزح. وفقًا لشركة برايس ووترهاوس كوبرز، 27٪ من المستخدمين الذين تفاعلوا مع زميلهم في خدمة العملاء مؤخرًا لا يعرفون ما إذا كانوا يتحدثون إلى إنسان أو روبوت محادثة.

يعد تطوير أنظمة وأجهزة المحادثة المعقدة أمرًا معقدًا وشاقًا للغاية. إنها لعبة كرة مختلفة تمامًا مع أساليب تطوير متميزة. لهذا السبب اعتقدنا أنه يجب علينا تقسيمها لك لتسهيل فهمها. لذا ، إذا كنت تبحث عن تطوير محرك ذكاء اصطناعي للمحادثة أو مساعد افتراضي ، فسيساعدك هذا الدليل في الحصول على الوضوح.

أهمية الذكاء الاصطناعي للمحادثة

نظرًا لأن التكنولوجيا أصبحت جزءًا أكثر تكاملاً من حياتنا في شكل أجهزة وأنظمة أحدث ، فهناك حاجة لدفع الحواجز وكسر الاتفاقيات والتوصل إلى طرق جديدة للتفاعل معها. من مجرد استخدام الأجهزة الطرفية المتصلة مثل الماوس ولوحة المفاتيح ، قمنا بالتبديل إلى وسادات الماوس التي توفر المزيد من الراحة. ثم انتقلنا بعد ذلك إلى شاشات اللمس التي وفرت مزيدًا من الراحة في تغذية المدخلات وتنفيذ المهام.

مع تحول الأجهزة إلى امتدادات لأنفسنا ، فإننا نفتح الآن وسيلة جديدة للأمر من خلال الصوت. لا نحتاج حتى لأن نكون بالقرب من جهاز لتشغيله. كل ما يتعين علينا القيام به هو استخدام صوتنا لفتحه والتحكم في مدخلاتنا. من غرفة قريبة ، أثناء القيادة ، أثناء استخدام جهاز آخر في نفس الوقت ، يؤدي الذكاء الاصطناعي للمحادثات المهام المقصودة لدينا بسلاسة. إذن من أين نبدأ - كل شيء يبدأ ببيانات الكلام عالية الجودة لتدريب نماذج تعلم الآلة.

أساسيات جمع بيانات التدريب على الكلام

إن جمع بيانات تدريب الذكاء الاصطناعي والتعليق عليها من أجل الذكاء الاصطناعي للمحادثة مختلف تمامًا. هناك الكثير من التعقيدات التي تنطوي عليها الأوامر البشرية ويجب تنفيذ تدابير متنوعة لضمان استيعاب كل جانب لتحقيق نتائج مؤثرة. لنلقِ نظرة على بعض أساسيات بيانات الكلام.

فهم اللغة الطبيعية (NLU)

بالنسبة لروبوتات الدردشة والمساعدين الافتراضيين لفهم ما نرسله أو نطلبه والرد عليه ، تسمى هذه العملية NLU تم تنفيذه. انها تقف ل فهم اللغة الطبيعية ويتضمن ثلاثة مفاهيم تقنية لتفسير ومعالجة أنواع المدخلات المتنوعة.

  • نية

    كل شيء يبدأ بالنوايا. ما الذي يحاول مستخدم معين نقله أو توصيله أو تحقيقه من خلال أمر؟ هل المستخدم يبحث عن المعلومات؟ هل ينتظرون تحديثات لإجراء ما؟ هل يأمرون بتعليمات النظام ليتم تنفيذها؟ كيف يأمرون بذلك؟ هل من خلال سؤال أم طلب؟ تساعد كل هذه الجوانب الآلات على فهم وتصنيف المقاصد والأغراض للتوصل إلى استجابات محكمة الإغلاق على التوالي.

  • جمع الكلام

    هناك فرق بين الأمر ، "أين أقرب جهاز صراف آلي؟" والأمر ، "اعثر لي على جهاز صراف آلي قريب." سيعترف البشر الآن بأن كلاهما يعني نفس الشيء ولكن يجب تفسير الآلات بهذا الاختلاف. إنهما متماثلان من حيث النية ، لكن الطريقة التي تشكلت بها النية مختلفة تمامًا.

    جمع الكلام هو كل شيء عن تحديد الكلمات والعبارات المختلفة وتخطيطها نحو أهداف محددة للتنفيذ الدقيق للمهام والاستجابات. من الناحية الفنية ، يعمل أخصائيو التعليقات التوضيحية على البيانات على بيانات الكلام أو البيانات النصية لمساعدة الآلات على تمييز ذلك.

  • استخراج الكيان

    كل جملة لها كلمات أو عبارات محددة تحمل أهمية مؤكدة وهذا التأكيد هو الذي يؤدي إلى تفسير السياق والغرض. الآلات ، مثل الأنظمة الجامدة ، تحتاج إلى تغذية مثل هذه الكيانات بالملعقة. على سبيل المثال ، "أين يمكنني العثور على أوتار من جيتاري بالقرب من شارع 6؟"

    إذا قمت بتنقيح الجملة ، ابحث عن الكيان الأول ، والسلاسل عبارة عن اثنين ، والجيتار هو ثلاثة ، والطريق السادس هو 6. يتم تجميع هذه الكيانات معًا بواسطة الآلات لاسترداد النتائج المناسبة ، ولكي يحدث هذا ، يعمل الخبراء في الواجهة الخلفية.

مجموعات بيانات الصوت / الكلام / الصوت الجاهزة لتدريب نموذج AI للمحادثة بشكل أسرع

تصميم الحوارات من أجل الذكاء الاصطناعي للمحادثة

كان الهدف من الذكاء الاصطناعي في الغالب هو تكرار السلوك البشري من خلال الإيماءات والأفعال والاستجابات. يمتلك العقل البشري الواعي القدرة الفطرية على فهم السياق والنية والنبرة والعواطف وعوامل أخرى والاستجابة وفقًا لذلك. لكن كيف يمكن للآلات أن تميز هذه الجوانب؟ 

تصميم الحوارات لـ محادثة منظمة العفو الدولية معقد للغاية والأهم من ذلك أنه من المستحيل تمامًا طرح نموذج عالمي. لكل فرد طريقة مختلفة في التفكير والتحدث والاستجابة. حتى في الردود ، كلنا نعبّر عن أفكارنا بشكل فريد. لذلك ، يجب على الآلات الاستماع والاستجابة وفقًا لذلك. 

ومع ذلك ، هذا ليس سلسًا أيضًا. عندما يتحدث البشر ، تظهر عوامل مثل اللهجات ، والنطق ، والعرق ، واللغة ، وغير ذلك ، وليس من السهل على الآلات أن تسيء فهم الكلمات وتسيء تفسيرها والرد عليها.. يمكن للآلات أن تفهم كلمة معينة بطرق لا تعد ولا تحصى عندما يمليها هندي وبريطاني وأمريكي ومكسيكي. هناك الكثير من حواجز اللغة التي تدخل حيز التنفيذ والطريقة الأكثر عملية للتوصل إلى نظام استجابة هي من خلال البرمجة المرئية التي تعتمد على مخطط انسيابي. 

من خلال الكتل المخصصة لـ يمكن للإيماءات والاستجابات والمحفزات والمؤلفين والخبراء مساعدة الآلات في تطوير الشخصية. هذا يشبه إلى حد كبير آلة الخوارزمية التي يمكن أن تستخدمها للتوصل إلى الاستجابات الصحيحة. عندما يتم تغذية أحد المدخلات ، تتدفق المعلومات عبر العوامل المقابلة ، مما يؤدي إلى الاستجابة الصحيحة للأجهزة لتقديمها. 

اطلب D للتنوع

كما ذكرنا ، التفاعلات البشرية فريدة جدًا. يأتي الأشخاص في جميع أنحاء العالم من مختلف مناحي الحياة والخلفيات والجنسيات والديموغرافيات والأعراق واللهجات والألقاب والنطق وغير ذلك. 

لكي يكون روبوت المحادثة أو النظام قابلاً للتشغيل عالميًا ، يجب تدريبه باستخدام أكبر قدر ممكن من بيانات التدريب. على سبيل المثال ، إذا تم تدريب النموذج باستخدام بيانات الكلام للغة أو عرق معين فقط ، فإن اللهجة الجديدة ستربك النظام وتجبره على تقديم نتائج خاطئة. لا يعد هذا الأمر محرجًا لأصحاب الأعمال فحسب ، بل إنه يمثل إهانة للمستخدمين أيضًا. 

لهذا السبب يجب أن تتضمن مرحلة التطوير بيانات تدريب على الذكاء الاصطناعي من مجموعة غنية من مجموعات البيانات المتنوعة المكونة من أشخاص من جميع الخلفيات الممكنة. كلما زاد عدد اللهجات والأعراق التي يفهمها نظامك ، أصبح أكثر عالمية. علاوة على ذلك ، فإن ما قد يزعج المستخدمين أكثر ليس الاسترجاع غير الصحيح للمعلومات ولكن الفشل في فهم مدخلاتهم في المقام الأول. 

يجب أن يكون القضاء على التحيز أولوية رئيسية ، وإحدى الطرق التي يمكن للشركات القيام بذلك هي اختيار بيانات التعهيد الجماعي. عندما تقوم بتجميع بيانات الكلام أو البيانات النصية الخاصة بك بشكل جماعي ، فإنك تسمح للأشخاص من جميع أنحاء العالم بالمساهمة في متطلباتك ، مما يجعل مجموعة البيانات الخاصة بك مفيدة فقط (اقرأ لدينا مدونة لفهم فوائد ومخاطر الاستعانة بمصادر خارجية لبيانات العاملين في مجال التعهيد الجماعي). الآن ، سوف يفهم نموذجك اللهجات والنطق المختلفة ويستجيب وفقًا لذلك. 

الطريق إلى الأمام

تطوير الذكاء الاصطناعي للمحادثة هو أمر صعب مثل تربية الرضيع. الفرق الوحيد هو أن الرضيع سينمو في النهاية لفهم الأشياء وتحسين التواصل بشكل مستقل. إنها الآلات التي يجب دفعها باستمرار. هناك العديد من التحديات في هذا المجال حاليًا ويجب أن نعترف بحقيقة أن لدينا بعضًا من أكثر أنظمة الذكاء الاصطناعي للمحادثة ثورية والتي نشأت على الرغم من هذه التحديات. دعنا ننتظر ونرى ما يخبئه المستقبل لروبوتات الدردشة المجاورة الودودة والمساعدين الافتراضيين. وفي الوقت نفسه ، إذا كنت تنوي الحصول على ذكاء اصطناعي للمحادثة مثل Google Home الذي تم تطويره لعملك ، تواصل معنا للحصول على بيانات التدريب على الذكاء الاصطناعي واحتياجات التعليقات التوضيحية.

شارك الاجتماعية