شرح البيانات – NER

التعرف على الكيانات المسماة (NER) شرح توضيحي للمعالجة اللغوية العصبية السريرية

تعليق توضيحي

بيانات نصية سريرية مشروحة جيدًا ومعيارية ذهبية لتدريب/تطوير البرمجة اللغوية العصبية السريرية لبناء الإصدار التالي من Healthcare API

لقد تم الاعتراف بشكل متزايد بأهمية معالجة اللغات الطبيعية السريرية (NLP) على مدى السنوات الماضية وأدت إلى تطورات تحويلية. تسمح البرمجة اللغوية العصبية السريرية لأجهزة الكمبيوتر بفهم المعنى الغني الكامن وراء تحليل الطبيب المكتوب للمريض. يمكن أن تحتوي البرمجة اللغوية العصبية السريرية على حالات استخدام متعددة تتراوح من تحليلات صحة السكان إلى تحسين التوثيق السريري إلى التعرف على الكلام إلى مطابقة التجارب السريرية وما إلى ذلك.

لتطوير وتدريب أي نماذج البرمجة اللغوية العصبية السريرية، تحتاج إلى مجموعات بيانات دقيقة وغير متحيزة وموضحة جيدًا وبأحجام هائلة. تساعد البيانات القياسية الذهبية والمتنوعة في تعزيز الدقة واستدعاء محركات البرمجة اللغوية العصبية.

الصوت

عدد الوثائق المشروحة
10
عدد الصفحات المشروحة
10 +
مدة المشروع
< 1 المقبلة.

التحديات

كان العميل يتطلع إلى تدريب وتطوير منصة معالجة اللغات الطبيعية (NLP) الخاصة به باستخدام أنواع الكيانات الجديدة وكذلك تحديد العلاقة بين الأنواع المختلفة. علاوة على ذلك، كانوا يقومون بتقييم البائعين الذين يقدمون دقة عالية، ويمتثلون للقوانين المحلية، ولديهم المعرفة الطبية اللازمة لشرح مجموعة كبيرة من البيانات.

كانت المهمة هي تسمية وتعليق ما يصل إلى 20,000 سجل مصنف بما في ذلك ما يصل إلى 15,000 سجل مصنف من بيانات السجلات الصحية الإلكترونية للمرضى الداخليين والخارجيين (EHR) وما يصل إلى 5,000 سجل مصنف من الإملاءات الطبية المكتوبة، موزعة بالتساوي عبر (1) مصادر جغرافية و ( 2) التخصصات الطبية المتوفرة.

لذا، لتلخيص التحديات:

  • تنظيم البيانات السريرية غير المتجانسة لتدريب منصة البرمجة اللغوية العصبية
  • تحديد العلاقة بين الكيانات المختلفة لاستخلاص المعلومات الهامة
  • القدرة والخبرة على تصنيف/تعليق مجموعة واسعة من الوثائق السريرية المعقدة
  • الحفاظ على التحكم في التكلفة لتسمية/تعليق كمية كبيرة من البيانات لتدريب البرمجة اللغوية العصبية السريرية ضمن الإطار الزمني المحدد
  • قم بتعليق الكيانات في مجموعة البيانات السريرية التي تتكون من 75% من السجلات الصحية الإلكترونية و25% من سجلات الإملاء.
  • إلغاء تحديد البيانات في وقت التسليم

تحديات أخرى في فهم اللغة الطبيعية

غموض

الكلمات فريدة من نوعها ولكن يمكن أن يكون لها معاني مختلفة اعتمادًا على السياق مما يؤدي إلى الغموض على المستويات المعجمية والنحوية والدلالية.

المرادفة

يمكننا التعبير عن نفس الفكرة بمصطلحات مختلفة وهي أيضًا مترادفة: كبير وكبير يعنيان نفس الشيء عند وصف شيء ما.

Coreference

تسمى عملية البحث عن جميع التعبيرات التي تشير إلى نفس الكيان في النص بتحليل المرجع الأساسي.

الشخصية والنية والعواطف

اعتمادًا على شخصية المتحدث، قد يتم التعبير عن نيته وعواطفه بشكل مختلف لنفس الفكرة.

الحلول

يتوفر حجم كبير من البيانات والمعرفة الطبية، في شكل وثائق طبية، ولكنها بشكل أساسي في شكل غير منظم. باستخدام التعليق التوضيحي للكيانات الطبية / التعليق التوضيحي للتعرف على الكيانات المسماة (NER)، تمكنت Shaip من تحويل البيانات غير المنظمة إلى تنسيق منظم من خلال إضافة تعليقات توضيحية إلى المعلومات المفيدة من أنواع متنوعة من السجلات السريرية. بمجرد تحديد الكيانات، تم أيضًا تعيين العلاقة فيما بينها لتحديد المعلومات المهمة.

نطاق العمل: شرح توضيحي لجهة الرعاية الصحية

9 أنواع الكيانات

  • حالة طبية
  • إجراء طبي
  • الهيكل التشريحي
  • الطب
  • جهاز طبي
  • قياس الجسم
  • تعاطي المخدرات
  • بيانات المختبر
  • وظيفة الجسم

17 المعدلات

  • معدّلات الدواء: القوة، الوحدة، الجرعة، من، التردد، المسار، المدة، الحالة
  • معدّلات قياس الجسم: القيمة، الوحدة، النتيجة
  • معدّلات الإجراء: الطريقة
    • معدّل بيانات المختبر: قيمة المختبر، وحدة المختبر، نتيجة المختبر
  • خطورة
  • نتيجة الإجراء

27 العلاقات وحالة المريض

نتيجة

سيتم استخدام البيانات المشروحة لتطوير وتدريب منصة البرمجة اللغوية العصبية (NLP) السريرية الخاصة بالعميل، والتي سيتم دمجها في الإصدار التالي من واجهة برمجة تطبيقات الرعاية الصحية الخاصة بهم. الفوائد التي حصل عليها العميل هي:

  • تتوافق البيانات المُصنفة/المشروحة مع إرشادات التعليقات التوضيحية القياسية للبيانات الخاصة بالعميل.
  • تم استخدام مجموعات البيانات غير المتجانسة لتدريب منصة البرمجة اللغوية العصبية لمزيد من الدقة.
  • العلاقة بين الكيانات المختلفة، أي بنية الجسم التشريحية <> الجهاز الطبي، الحالة الطبية <> الجهاز الطبي، الحالة الطبية <> الدواء، الحالة الطبية <> تم تحديد الإجراء لاستخلاص المعلومات الطبية الهامة.
  • تم أيضًا إلغاء تحديد المجموعة الواسعة من البيانات التي تم تصنيفها/التعليق عليها في وقت التسليم.

أدى تعاوننا مع Shaip إلى تطوير مشروعنا بشكل كبير في مجال التكنولوجيا المحيطة والذكاء الاصطناعي للمحادثة في مجال الرعاية الصحية. وقد وفرت خبرتهم في إنشاء وتسجيل حوارات الرعاية الصحية الاصطناعية أساسًا متينًا، وعرض إمكانات البيانات الاصطناعية في التغلب على التحديات التنظيمية. مع Shaip، تغلبنا على هذه العقبات ونقترب الآن خطوة من تحقيق رؤيتنا لحلول الرعاية الصحية البديهية.

الذهبي 5 نجوم

تسريع الذكاء الاصطناعي للمحادثة
تطوير التطبيقات بنسبة 100٪