مطالبات الدفع عبر واجهة UPI الصوتية: الاستفادة من التنوع لتحسين نماذج الذكاء الاصطناعي

الاستفادة من خبرة Shaip في الإنشاء السريع والتسجيلات الصوتية المتنوعة لدعم أنظمة الدفع UPI المستندة إلى الصوت مع بيانات عالية الجودة ومتنوعة ثقافيًا.

مطالبات الدفع عبر UPI المستندة إلى الصوت

نظرة عامة على المشروع

تعاونت شركة Shaip مع شركة رائدة في مجال التكنولوجيا المالية لتطوير تطبيق دفع صوتي من خلال إنشاء وتسجيل مطالبات دفع UPI المتنوعة. وتضمن المشروع إنشاء 2,500 مطالبة فريدة و87,000 مطالبة متنوعة عبر 13 نية متعلقة بالدفع، مثل إرسال الأموال وطلب الأموال والاستعلام عن الرصيد ودفع الفواتير. وقد تم تسجيل هذه المطالبات على مدار 200 ساعة بواسطة 45 متحدثًا من مناطق وخلفيات وفئات عمرية متنوعة، مما يضمن مجموعة واسعة من التنوع اللغوي والبيئي.

كان هدف المشروع هو تطوير بيانات تدريب عالية الجودة لنموذج الذكاء الاصطناعي الذي يمكنه التعرف على الأوامر الصوتية المتعلقة بمدفوعات UPI والاستجابة لها في إعدادات العالم الحقيقي.

الدفع عبر UPI عبر الصوت

إحصائيات أساسية

ساعات صوتية من مطالبات الدفع عبر UPI تم تسجيلها

200

المتحدثون من خلفيات متنوعة (العمر والتعليم والمنطقة)

45

تم تغطية النوايا، مع أكثر من 87,000 مطالبة متنوعة

13

اللغات: الإنجليزية، مع متحدثين من خلفيات لغوية أصلية مختلفة (الكوماوني، البنغالية، المالايالامية، الغوجاراتية، الهندية، الماراثية وغيرها)

نطاق المشروع

إنشاء المطالبة

شمل النطاق إنشاء مطالبات فريدة لنظام دفع UPI قائم على الصوت. تم تصميم المطالبات لتغطية نوايا متعددة، مع ضمان تنوعها في البنية والمفردات والكيانات المسماة. تضمنت بعض الجوانب الرئيسية ما يلي:

13 غرضًا رئيسيًا، بما في ذلك:

  • إرسال الأموال: 65,653 مطالبة فريدة ومتنوعة
  • الاستعلام عن الرصيد: 3,052 مطالبة
  • طلب المال: 26,972 مطالبة
  • سجل المعاملات، إعادة الشحن، دفع الفواتير، وما إلى ذلك.

تسجيل صوتي

ولضمان الأصالة والتطبيق في العالم الحقيقي، تم تسجيل المطالبات من قبل 45 متحدثًا من خلفيات لغوية مختلفة. وساعد التنوع الذي تم التقاطه من خلال اللغات الأصلية المختلفة واللهجات الإقليمية والبيئات (الداخلية والخارجية) في تحسين بيانات التدريب.

  • التنوع اللغوي: المستخدمون يتقنون اللغة الإنجليزية ولكن مع لغات أصلية متنوعة، مثل الكوماوني، والغوجاراتية، والهندية، والبنغالية، والماراثية، والمالايالامية.
  • العمر والجنس والخلفية التعليمية: التقطت البيانات مجموعة واسعة من التركيبة السكانية.
  • المتحدثون في المناطق الحضرية والريفية: ولعكس الاستخدام في العالم الحقيقي، تم تضمين المتحدثين في المناطق الحضرية والريفية.
  • بيئة التسجيل: تم إجراء التسجيلات الصوتية في أماكن داخلية وخارجية، مع تضمين مجموعة متنوعة من الضوضاء في الخلفية.

التحديات

التنوع اللغوي والإقليمي

إن ضمان أن تعكس المطالبات اللهجات الإقليمية المتنوعة وخصائص المتحدث يتطلب تخطيطًا وتنفيذًا دقيقين.

اختلافات الصوت الطبيعية

كان التعامل مع الضوضاء الخلفية والظروف البيئية (الداخلية مقابل الخارجية) أمرًا بالغ الأهمية للتطبيق في العالم الحقيقي.

ملفات تعريف المتحدثين المتنوعة

أدى إشراك المتحدثين من مختلف الفئات العمرية والخلفيات التعليمية والمناطق الريفية / الحضرية إلى تعقيد عملية التقاط البيانات الأصلية.

الحلول

قدم شايب حلاً عالج تحديات المشروع من خلال تنفيذ تقنيات معالجة اللغة الطبيعية المتقدمة والتخطيط الدقيق في كل من الإنشاء والتسجيل الفوري. الجوانب الرئيسية للمشروع
الحل يشمل:

إنشاء المطالبة

  • 2,500 تم إنشاء مطالبات فريدة من نوعها، كل منها متنوع من حيث البنية والمفردات.
  • 13 وقد تم تغطية العديد من المقاصد، بدءًا من طلبات الدفع الأساسية وحتى الاستفسارات الأكثر تعقيدًا مثل سجل المعاملات ودفع الفواتير.

تسجيل صوتي

  • 200 ساعة من التسجيلات الصوتية التي أجريت بواسطة المستخدمين 45، مما يضمن التنوع عبر اللغات الأصلية والبيئات والتركيبة السكانية للمتحدثين.
  • تم استخدام البيئات الداخلية والخارجية للتسجيل لضمان التنوع الطبيعي للصوت.
  • مثّل المتحدثون مجموعة واسعة من اللهجات الإقليمية، مما يضمن التمثيل اللغوي الدقيق.
نيةإرسالالاستفسار عن الرصيدطلب المالالتاريخ المعاملة
موجهقم بدفع مبلغ عشرين ومائتي دولار إلى سومطرة مقابل إيجار المنزلأريد أن أعرف رصيدي الحالي في حساب التوفير الخاص بي.هل يمكنك أن تطلب راجي ثلاثمائة وثمانية عشر روبية في حالة الطوارئ؟
أظهر لي سجل معاملات بطاقة الخصم الخاصة بي.
الغوجاراتيةالحصول على بطاقة الائتمان الخاصة بكالحصول على بطاقة الائتمان الخاصة بك هذا هو الحال.ما هو أفضل ما عليك فعله ما هو الحل?لا داعي للقلق بشأن هذا الأمر.
الهنديةالحصول على إيكيس من أجل الحصول على المال |أرغب في الحصول على وقت فراغي في الوقت الحالي.هل يمكنك أن تربح أكثر من ثلاثة روبية مقابل أي حالة طوارئ؟ظهرت بطاقة الخصم الخاصة بي ميرا ليندن بورا.
المالايالاميةمعلومات أساسية كل هذا.هذا ليس كل شيء هذا كل ما في الأمر.أفضل ما يمكن أن يكون عليه الأمر ما هو الحل?كل ما تحتاجه هو هذا الأمر.
التيلجوهذا هو ما تبحث عنه شكراما هو أفضل خيار لك هذا هو الحال.ما هو الشيء الذي يجب عليك فعله ما هو الأفضل?ما يجب عليك فعله هو الحصول على بطاقة الائتمان الخاصة بك شكرا.
البنغالية البنغاليةأفضل ما يمكنك فعله هو الحصول على بطاقة الائتمانلقد كنت سعيدًا جدًا بالتسوق هذا هو.لا داعي للقلق بشأن عطلتك لماذا لا تفعل ذلك?لقد حصلت على بطاقات الائتمان الخاصة بك.
المراتيةإيجار منزل إجمالي يمكّنك من استئجار سيارة بسعر معقولما الذي يجب علي فعله هو الحصول على الكثير من البالونات الخفيفةهل يمكن أن يكون المراهقون الراجيون في سن المراهقة قادرين على الإنجاب ?ما الذي يجعل بطاقة الخصم الخاصة بي أسهل من أي وقت مضى.

نتائج

سمحت البيانات الصوتية المتنوعة عالية الجودة التي قدمها Shaip للعميل بتطوير نظام دفع UPI قائم على الصوت مدفوعًا بالذكاء الاصطناعي وقادرًا على التعرف على الأوامر في لهجات وبيئات وسياقات مختلفة. ساعدت البيانات في تحسين:

  • التعرف على الصوت في الوقت الحقيقي في البيئات المعقدة.
  • معاملات UPI أكثر دقة التعامل مع مجموعة أوسع من المستخدمين.
  • التدرجية: يشكل المشروع أساسًا قويًا للتوسع في اللغات الهندية الأخرى.

التسليمات

  • 200 ساعة ملفات الصوت (تنسيق WAV PCM 8 كيلو هرتز، أحادي)
  • +87,000 مطالبات متنوعة موضحة بنوايا فريدة
  • البيانات الوصفية: ملفات تعريف المتحدث وتفاصيل البيئة ودقة النسخ

كانت قدرة شايب على التقاط تنوع الهند من خلال المطالبات الفريدة والتسجيلات الصوتية الأصيلة بمثابة نقطة تحول في نظام الدفع UPI القائم على الصوت. لقد ضمن فريقهم التعامل مع كل جانب من جوانب المشروع - من الإنشاء الفوري إلى جودة التسجيل - بدقة، مما ساعدنا في بناء نموذج أكثر شمولاً وقوة للتعرف على الصوت.

الذهبي 5 نجوم