با تعامل زیاد تر با راوی فیدیبو میتوانید با لحن و صدای محبوب خود کتاب بشنوید

شلوغی زندگی روزمره امکان مطالعه کتاب را از تعداد بسیاری از افراد گرفته است، اما در این بین، کتابهای صوتی نور امیدی برای برگشت کتاب به زندگی پرمشغله امروزی می باشند. محصول «راوی» از فیدیبو یک قدم از کتاب صوتی فراتر رفته و قرار است با پشتیبانی هوش مصنوعی، همه کتابها را برای کاربران بخواند. مدیر پروژه راوی این محصول را از هر دو جنبه مقداری و کیفی روبهگسترش دانست و خبرداد که او گفت و گو و دغدغه مهم آنها افزایش کیفیت تلفظها و گسترش دایره لغات سیستم است.
«مهرزاد کریمی»، مدیر پروژه راوی، درمورد علت شکلگیری این محصول و ریسک قیاس ناخودآگاه کیفیت آن با کتاب صوتی در ذهن مخاطب به دیجیاتو او گفت: «در ابتدا باید به این مسئله مهم اشاره کنم که راوی بخشی از یک سیستم بزرگتر تشکیل کتاب صوتی است. از ابتدای مسیر، ما فقطً بهجستوجو گسترش یک سیستم متن به صوت نبودیم و با دقت به گرهخوردن تکنولوژی به زندگی اقشار گوناگون جامعه و استقبال آشکار و چشمگیر از محتوای صوتی در حوزه کتاب، تصمیم به گسترش این ویژگی گرفتیم. ریسک آشکار قضیه هم قیاس ناخودآگاه آن با گویندگان صوتی حرفهای می بود.»
شما میتوانید با راوی تعامل داشته باشید

کریمی در جواب به این سوال که راوی دقیقاً چیست و قرار است چهکار کند؟ او گفت: «راوی یکی از اجزای سیستم بزرگتر تشکیل محتوای صوتی است که با منفعت گیری از هوش مصنوعی گسترش داده شده. ماموریت یا مقصد مهم این زیرسیستم، تبدیل محتوای متنی به صوتی است که کنترلپذیری و توانایی تحول ویژگیهای صوت تولیدی از مقصدهای مهم و فرعی آن به حساب می اید. بهطور کلی و مقداری فنیتر، راوی را میتوانیم در دسته مدلهای مولد یا Generative در ادبیات هوش مصنوعی قرار دیم.»

به باور او، راوی به کاربران اجازه خواهد داد که در کمترین زمان ممکن، از محتوای صوتی بهجای متنی منفعت گیری کنند. کریمی از امکان تعامل با این سیستم خبر داد؛ آنهم بهنحوی که امکان پیداکردن لحن موردعلاقه افراد وجود داشته باشد. او دراینباره او گفت: «با اضافهشدن ویژگیها در طول زمان، کاربران بستر تعامل با سیستم را اشکار خواهند کرد؛ بهصورتیکه میتوانند محتوای صوتی موردنظر را با ویژگیهای موردنظرشان گوش کنند (برای مثال، با صدای گوینده یا لحن موردعلاقه خودشان) که این بستر تعاملی با اهمیت ترین تفاوت با کتاب صوتی تولیدشده توسط گوینده انسان است.»
لایه اول جامعه مقصد راوی: افراد نابینا و کمبینا
سالها است که فراهمکردن دسترسی عادی به محتویات فرهنگی و درسی برای افراد نابینا و کمبینا به دغدغهای برای جامعه تبدیل شده است. کریمی دراینباره او گفت: «کاربران نابینا یا کمبینا، در لایه اول، با اهمیت ترین کاربران این ویژگی شناخته خواهد شد و مسلماً گسترش یکسری ویژگیها همانند توانایی جابهجایی بین متن و صوت و… برای این دسته از کاربران با وسواس بیشتری پیگیری خواهد شد.»
او در ادامه افزود: «اکنون همه علاقهمندان به محتوای کتاب صوتی یا audiobookها میتوانند از این ویژگی منفعتمند شوند. یقیناً با پیشرفت این سیستم در طول زمان و اضافهشدن ویژگیهای متنوعتر، طیف گستردهتری از مخاطبین جذب خواهند شد.»
راوی، محصولی درحال گسترش مقداری و کیفی
مدیر پروژه راوی درمورد تصمیمهای گوناگون برای نحوه رونمایی این محصول توضیحاتی داد: «برای رونمایی از راوی دو نوع رویکرد وجود داشت. رویکرد اول چیزی همانند به مترجم گوگل می بود؛ این که این ابزار را برای محتوایی سبکتر و محدودتر و با تعداد محدودی کاراکتر متنی برای کاربران فعال کنیم و در طول زمان با یادگیری زیاد تر و جمعآوری بازخوردها، آن را به محتواهای بزرگتر و گسترش یافتهتر همانند متن کتاب گره بزنیم.»
او معتقد است که رویکرد اول ریسک کمتری داشت و با این روش، زمان بیشتری برای گسترش سیستم مورد نظر صرف میشد، اما تصمیمگیرندگان پروژه راوی رویکرد دوم را انتخاب کردند: «رویکرد دوم چیزی همانند به ChatGPT می بود؛ رویکردی تهاجمی یا eager که بر پایه آن، نسخه یک محصول را بهطور کامل در اختیار کاربر قرار میهیم. این رویکرد ریسک بیشتری دارد و علتمیبشود که کاربران با همه نقاط ضعف و قوت ورژن جاری آشنا شوند.»
او افزود: «ما با ۱۵۹ کتاب که نسخه صوتی آن وجود نداشت، اغاز کردیم و همه محتوای آن را در اختیار کاربر قرار دادیم تا با همه ویژگیهای این ورژن در مقیاس بزرگ و تنوع بالا آشنا بشود.»
مدیر پروژه راوی از افزایش مقداری و کیفی این محصول در طول زمان خبر داد و او گفت: «با دقت به این که توانایی این چنین ویژگی در حوزه کتاب و در داخل وجود نداشت و مثالهای خارجی نیز با احتیاط بسیاری در حوزه کتاب داخل شدهاند، تصمیم گرفتیم ویژگیها را بعد از جمعآوری بازخورد کاربران بهصورت دورهای اضافه کنیم و تعداد کتابها را همراه با بهبود کیفیت و اعمال بازخورد کاربران افزایش دهیم.»
او باور دارد که حجم کار در این مقیاس و این تنوع از نظر فنی یک چالش بزرگ و فرایندی زمانبر است که این نوشته هم بهمرور بهبود خواهد یافت.
مقصد ما تشکیل کتاب صوتی با امکان دخالت سلیقه کاربر است
به باور کریمی، از ابتدا مقصدگذاری آنها بلندپروازانه و ایدهآلگرایانه بوده است. او درمورد چشمانداز آینده این محصول او گفت: «مقصد مهم ما تشکیل کتاب صوتی همراه با دخالتدادن سلیقه کاربر در این فرایند است. تنوع زبان، لحن، گوینده، موسیقی عرصه، اعمال بازخورد همزمان کاربر و… همه و همه ازجمله ویژگیهایی است که به آن فکر کرده و در سیستم درنظر گرفتهایم که در نسخههای آتی اضافه خواهند شد.»

او در ادامه افزود: «او گفت و گو و دغدغه مهم ما افزایش کیفیت تلفظها و گسترش دایره لغات سیستم بوده و خواهد می بود که مهمترین چالش در تشکیل محتوا در این مقیاس و با این تنوع است. ویژگیهایی که به آن اشاره شد، طراحی شدهاند و بهمرور در اختیار کاربران قرار خواهند گرفت؛ از این بابت مطمعن کامل داشته باشید.»
درنهایت مدیر پروژه راوی در جواب به این سوال که آیا در ادامه به این محصول کاربردهای دیگر همانند امکان خلاصهسازی و ترجمه هم اضافه میبشود یا خیر، او گفت: «قطعاً با پشتیبانی مخاطبان بینظیر فیدیبو، پیشرفتهای حالحاضر تکنولوژی و شور و علاقه ما برای گسترش و پیشرفت فرهنگ کتابخوانی، همه اینها ممکن خواهد می بود. فکر میکنم با اهمیت ترین فاکتور، اراعه نظرات، پیشنهادها و انتقادات به هر صورتی و در هر مقیاسی از سوی همه مخاطبان است.»