مرکز تماس هوشمند
این محصول بهمنظور استقرار یک مرکز تماس هوشمند با قابلیت درک صوت کاربران و تعامل با آنها در یک مرکز ارائهدهنده خدمات اینترنتی پیادهسازی شده است. اهداف آتی این محصول استقرار در سایر مراکز تماس است. شایانذکر است هر یک از زیربخشهای پروژه قابلیت بهکارگیری در سایر کاربردهای مستقل را دارا هستند.
مشخصات فنی:
این محصول متشکل از واحد هوش مصنوعی و واحد نرمافزاری برای ارائه خدمات و تعامل با سایر سامانهها است. اعم پیادهسازیهای انجامشده برای واحد هوش مصنوعی به زبان پایتون است. از طریق چندین API به سرورهای نرمافزاری اجازه استفاده از مدلهای هوش مصنوعی داده میشود. وظیفه سرورهای نرمافزاری راهاندازی شده به زبانهای پایتون و جاوا، دریافت صدای کاربران (فناوری صدا بر روی آیپی)، پردازش و ارسال آن به سرور هوش مصنوعی و اخذ پاسخ مناسب، جلو بردن مسیر تعامل با کاربر و انتخاب مسیر مناسب، و درنهایت ارائه APIهای لازم برای استفاده از این سرور بهمنظور استقرار و تعبیه در سرورهای بازار هدف است. حل این مسئله بسیار چالشی تنها توسط صنعت نرمافزار قابلحل نیست و نیاز به یک گروه هوش مصنوعی دارد. زیرا مهمترین جزء این پروژه پردازش و درک مفهوم صدای تلفنی کاربرانی است که با مرکز تماس ارتباط برقرار میکنند. شرکت با در اختیار داشتن تیم هوش مصنوعی ضمن دارابودن مهارتهای نرمافزاری درصدد حل این مسئله است. از طرفی، نوع داده بهکاررفته در این پروژه بر دشواریهای انجام آن میافزاید. زیرا پردازش و درک داده صوتی تلفنی به دلیل کیفیت کمتر صداها بهمراتب دشوارتر از داده صوتی غیر تلفنی است. همچنین متون محاورهای نسبت به متون رسمی دارای دشواریهای پردازشی بالاتری است. پردازش دادههای صوتی تلفنی نهتنها در زبان فارسی ابزار مناسبی ندارد بلکه برای سایر زبانها نیز ابزارهای کمتری در مقایسه با نسخه غیر تلفنی دارد. در مورد پردازش متون محاوره فارسی همچنان ابزار قدرتمندی توسط رقبای داخلی توسعه داده نشده است. لذا عدم وجود رقیبی بلامنازع خاصه در حوزه پردازش دادههای صوتی تلفنی و پردازش متون محاوره فارسی از جمله مهمترین مزایای محصول پیشنهادی است. علاوه بر این پروژهای در این سطح متشکل از تمام واحدها در مقیاس یک مرکز تماس در حوزه زبان فارسی مغفول باقیمانده است. شایانذکر است که در تمام بخشهای مذکور با توجه به آنکه زبان فارسی نسبت به سایر زبانها جزء زبانهای با منابع محدود است لذا بخشی از تلاش و وقت پروژه صرف آمادهسازی و تهیه داده مناسب شده است. از سوی دیگر عدم توانمندی مدلهای چندزبانه خارجی که بخشی از زبان فارسی را پوشش میدهند ایجاب میکرد تا مدلی بومیسازی شده توسعه داده شود. این مورد خاصه در مورد دادههای تلفنی فارسی و دادههای متن محاورهای فارسی بیشازپیش حائز اهمیت است. به طور مختصر طراحی مدل پیشنهادی نیز فارغ از نوع داده نبوده است و از طریق بررسی متعدد مقالات علمی و مستندات، مدلی خاصمنظوره مختص این نوع از دادگان پیشنهاد گردید. زیرا خطای بالا در این نوع از دادگان منجر به خطای پروژه میگردد و لذا مسئله ایجاب میکرد تا مدلی با مقاومت بالا نسبت به خطا و نویز دادگان توسعه داده شود. سیستم پیشنهادی متشکل از دو واحد اجرایی هوش مصنوعی و واحد نرمافزاری است. با توجه به دشواریهای مسیر هوش مصنوعی، اهم تلاش شرکت در ابتدا معطوف به این بخش بوده است و واحد نرمافزار آن سپس در دستور کار قرار گرفت. در ادامه اهم بخشهای انجامشده در هر دو واحد تشریح میگردد. به دلیل آنکه اغلب پروژههای مبتنی بر هوش مصنوعی نیازمند چرخه تهیه داده، آموزش و ارزیابی مدل هستند، لذا اقدامات صورتگرفته در این حوزه بهصورت اجمالی ارائه میگردد:
دادههای بخش مدل آوایی (تشخیص گفتار) متشکل از دو بخش دادههای تلفنی صوتی و دادههای غیر تلفنی صوتی تهیه گردیده است.
پردازشهای لازم بهمنظور آمادهسازی دادههای صوتی از قبیل متن گفتارها
آمادهسازی دادههای متنی شامل دادگان متون رسمی/محاورهای
آمادهسازی ابزارهای پردازشی متون خاص متون رسمی/محاورهای و پردازش متنها (شایانذکر است این بخش از توسعههای انجامشده منتج به ارائه یک مقاله در یک کنفرانس علمی و ارائه یک ابزار متنباز گردیده است.)
آمادهسازی ابزارهای دریافت دادگان از مرکزی که قرار است این محصول در نسخه اول در آنجا راهاندازی شود.
آموزش نسخههای اول مدل درک گفتار بر روی دادگان مرکز تماس مذکور
آموزش مدلهای متن به گفتار بهمنظور انتخاب مدل
تهیه مجموعهداده شخصیسازیشده و درنظرگرفتن ملاحظات برای آموزش مدلهای متن به گفتار
نوع مشتریان/ کاربران محصول:
با با توجه به تنوع قابلیتهای اجزای پروژه هر یک قابلیت عرضه در بازاری مجزا را نیز دارا هستند.
بازاری که نیازمند سیستم تشخیص گفتار تلفنی یا غیر تلفنی باشد. این محصول با آموزش اندکی بر روی آن دادهها قابلیت تعمیمپذیری دارد.سیستم تولید صدا از روی متن که در تمام حوزههای هوشمندسازی و ارائه خدمات گفتاری مستقل از متن قابلیت اجرایی دارد.استخراج متن حاصل از گفتار از طریق سیستم پردازش صوت قابل بیان است.سیستم چتبات که تنها مختص خدمات حوزه خدمات اینترنتی نیست و به تمام مراکز ارائهدهنده خدمات تلفنی قابل تعمیم است.سایر ابزارهای میانی توسعه داده شده بهمنظور حصول محصولات اصلی که خود بازار بالقوهای را دارد. ابزارهای پردازش متن و صوت که در ضمن پروژه توسعه داده شدهاند از مهمترین موارد هستند.در مورد واحد نرمافزار موارد زیر به طور مختصر ذکر میگردد:
دریافت صدا از تماس تلفنی پردازش اولیه صوتسرور میانی که از آن طریق محصول پیشنهادی بتواند در مرکز تماس مذکور مستقر گردد، در حال پیادهسازی است.