۵ روش آسان برای ساخت هوش مصنوعی شخصی خودتان

به تازگی استفاده از هوش مصنوعی یا همان AI در دستگاه هایی مانند Echo آمازون و گوگل Home مورد توجه خریداران قرار گرفته است. اکنون در سال 2020 شما به عنوان یک برنامه نویس می توانید به سادگی از طریق API هایی که برخی شرکت ها در اختیار کاربران قرار می دهند در ساخت نرم افزار ها و ربات های دستیار شخصی از تکنولوژی AI استفاده کنید.
3.8605577689243 از 5
از 251 رای
(رای دهید)
۵ روش آسان برای ساخت هوش مصنوعی شخصی خودتان

تکنولوژی دستیار شخصی با قابلیت پاسخ به درخواست ها، یک تکنولوژی کاراست که در طی چند سال اخیر بسیار گسترده شده است. اکنون در سال ۲۰۲۰، بسیاری از نرم افزار های پیام رسان از ربات ها و دستیاران شخصی پشتیبانی می کنند. مثلا ربات های تلگرامی وجود دارند که بر اساس متنی که شما تایپ و ارسال می کنید می توانند پاسخ منحصر به فردی برای شما ارسال کنند.

برای آن دسته از برنامه نویسانی که مشتقاند در نرم افزار های خود از هوش مصنوعی استفاده کنند، برخی شرکت ها، API های فوق العاده ساخته شده بر روی برترین هوش مصنوعی ها را ارائه می دهند. این API ها به صورت کاملا Restful در اختیار برنامه نویس قرار می گیرد و هیچ محدودیتی در زبان برنامه نویسی استفاده شده برای آن ها وجود ندارد.

این هوش های مصنوعی قابلیت شناسایی صدا (Voice Recognition) و یادگیری ماشینی (Machine Learning) را در اختیار برنامه نویسان قرار می دهند تا به سادگی در ساخت نرم افزار ها و ربات های خود از آن ها استفاده کنند.

قابلیت یادگیری ماشینی یا همان Machine learning اساس ساخت یک هوش مصنوعی است. هوش مصنوعی باید علاوه بر اطلاعات اولیه ای که می گیرد، بتواند بسیاری اطلاعات را بر اساس مثال هایی که به آن می دهند دریافت و از آن ها استفاده کند.

۱- Wit.ai، یک API هوش مصنوعی مناسب تازه کاران

Wit.ai نام یک هوش مصنوعی است که قابلیت شناسایی صدا و یادگیری ماشینی فوق العاده ای را همزمان در اختیار برنامه نویسان قرار می دهد. این هوش مصنوعی می تواند صدا را به متن تبدیل کند و به سادگی بیاموزد که چگونه به آن ها به چشم یک دستور نگاه کند و عکس العمل مناسب نشان دهد.

Wit.ai با قابلیت Machine learning که ارائه می دهد به برنامه نویس کمک می کند با ارائه مثال ها این نرم افزار را برای عکس العمل نشان دادن مناسب تربیت کند. این هوش مصنوعی پس از یادگیری پاسخ هایی ارسال می کند که قبلا برنامه نویس آن ها را به هوش مصنوعی ارائه نداده است.

دو قسمت اصلی در Wit.ai وجود دارد، یکی اهداف (Intents) و دیگری موجودیت ها (Entities).

در حالی که اهداف یا همان Intents اشاره به یک عمل دارند مانند “یک لامپ را خاموش کن”. موجودیت ها اشاره دقیقی به آن وسله که نیاز به انجام عملیات بر آن است دارد (کدام لامپ؟ لامپ قرمز؟ آیا باید به رنگ دیگری تغییر کند؟).

این هوش مصنوعی برای اینکه برنامه نویس مجبور نباشد همه اهداف Intents را از اول بنویسد بسیاری از این Intent ها را به صورت پیشفرض ارائه می دهد.

Wit.ai از حالت داستان (Story mode) هم پشتیبانی می کند. حالتی که شما می توانید در آن با مشخص کردن شاخه های مختلف پاسخ، یک داستان را تا آخر مدیریت کنید. مثلا وقتی می پرسید “حالتان خوب است؟” چند پاسخ مانند “نه اصلا!” یا “بله خوبم” جلو شخص قرار دهید تا با انتخاب هر یک به شاخه مربوط به نتایج پاسخ خود برسد. مثلا اگر کاربر گفت “نه اصلا!” در پاسخ بگویید: “چرا خوب نیستی؟” و لیست پاسخ های “چون مریضم” یا “چون حوصلت رو ندارم” را به کاربر برگردانید تا یکی را انتخاب کند و در نهایت با طی کل مسیر شاخه ها به نتیجه نهایی برسید.

از Wit.ai می توانید برای ساخت نرم افزار iOS, Android, Node.js, Raspberry Pi, Ruby, Python, C, Rust و Windows Phone استفاده کنید.

۲- Api.ai، نام مشخص برای یک کار مشخص

Api.ai یک هوش مصنوعی مشابه Wit.ai می باشد. این هوش مصنوعی نیز قابلیت شناسایی صدا و یادگیری ماشینی را در اختیار برنامه نویسان قرار می دهد.

گوگل از سال ۲۰۱۶ این هوش مصنوعی را خریداری کرده و اکنون پشتیبانی می کند. اکنون این روش، یکی از اصلی ترین روش های برنامه نویسی برای گوگل Home است.

یکی از تفاوت های اصلی بین Api.ai و wit.ai پشتیبانی از Domain است. دومین ها مجموعه هایی از اطلاعات و ساختار داده هستند که می توانند در هر Agent مورد استفاده قرار بگیرند (اپ ها در Api.ai در واقع Agent گفته می شوند).

دومین ها می توانند شامل داده ها و نوع داده ها باشند و توانایی تفکیک نوع داده ها را هم به نرم افزار ارائه می دهند. مثلا تفاوت بین Book hotel و Buy a book برای این هوش مصنوعی مشخص است. (کلمه Book اول به معنای رزرو و Book دوم به معنای کتاب)

Api.ai برای استفاده رایگان است اما اکنون در سایتشان کاملا مشخص نیست چطوری باید از نسخه رایگان استفاده کرد و گفته می شود از سال ۲۰۱۶ “کاملا” رایگان نیست. باید برای دریافت نسخه ای از این هوش مصنوعی به مسئولان سایت ایمیل بزنید.

Api.ai دارای SDK برای اندروید، iOS، کورتانا، Node.js، یونیتی، Xamarin، پایتون و جاوا اسکریپ است.

۳- Mellisa، بسیار مناسب برای استفاده با Raspberry Pi

اگر شما دوست دارید قسمت پس زمینه کار را بیشتر خودتان بنویسید و از طرفداران Raspberry Pi نیز هستید، Mellisa هوش مصنوعی مناسب شماست.

ملیسا نام هوش مصنوعی است که به صورت متن باز با استفاده از Python نوشته شده و قابل استفاده از بر روی Raspberry pi ، ویندوز، لینوکس و OS X است.

این هوش مصنوعی اخیرا بار ها بروزرسانی شده و مورد توجه برنامه نویسان قرار گرفته است.

هوش مصنوعی ملیسا قابلیت دریافت فرمان صوتی همشه فعال را دارد و بسیاری از فرمان های پیشفرض را در خود ذخیره کرده است. فرمان هایی مانند: “یک یادداشت بردار” یا “از ویکی پدیا اطلاعات این مکان را در بیاور” یا “موزیک پخش کن” به صورت پیشفرض به برنامه نویس در این هوش مصنوعی ارائه می شود.

۴- Clarifai، هوش مصنوعی با قابلیت یادگیری از عکس و ویدئو

Clarifai یک هوش مصنوعی با نگرشی کاملا متفاوت از دیگر هوش مصنوعی هایی است که معرفی کردیم. این هوش مصنوعی قابلیت پردازش و شناسایی تصویر دارد.

این هوش مصنوعی یک الگوریتم یادگیری ماشینی (Machine learning) بسیار قدرتمند عمیق دارد که با هر بار استفاده قوی تر می شود.

اگر می خواهید به ربات خود یک هوش مصنوعی بدهید که فراتر از فرمان های صوتی را بفهمد، چرا به آن قابلیت تشخیص تصویر ندهید؟

این هوش مصنوعی می تواند تصاویر را دریافت کند و در اینترنت به دنبال تصاویر مشابه بگردد و یا تصاویر با محتوای نا مناسب را علامت گذاری کند.

اگر شما می خواهید قابلیت های Carifai را افزایش دهید می توانید به این هوش مصنوعی مثال های خودتان را ارائه دهید تا با دیدن مثال ها به یادگیری بپردازد.

برای استفاده از Clarifai در نرم افزار خود، می توانید از Api این هوش مصنوعی که به صورت کاملا Restful ارائه می شود استفاده کنید. با Api این هوش مصنوعی محدودیت در انتخاب زبان برنامه نویسی برای استفاده با آن نخواهید داشت.

۵- TensorFlow، هوش مصنوعی برای حرفه ای ها!

اگر می خواهید از سطح این هوش مصنوعی های معمولی برای ساخت سرویس بالاتر بروید و یک هوش مصنوعی واقعی بسازید، TensorFlow گوگل، ابزار مناسب شماست.

راه اندازی یک هوش مصنوعی با TensorFlow زمان زیادی می برد، اما با طی این زمان شما یادگیری عمیق تری از هوش مصنوعی خواهید داشت.

TensorFlow یک کتابخانه نرم افزار متن باز برای پردازش عددی (open source software library for numerical computation) با استفاده از جریان گراف ها (flow graphs) است.

TensorFlow ابزار فوق العاده برای استفاده در پردازش تصویر و یا تشخیص صدا و زبان است.

با استفاده از TensorFlow می توانید ربات های چت فوق العاده ای که با استفاده از مثال متنی تمرین داده شده اند بسازید.

رای شما به "۵ روش آسان برای ساخت هوش مصنوعی شخصی خودتان" چیست؟

رای شما با موفقیت ثبت شد.

ثبت رای شما با پیغام خطا همراه بود.

195 پاسخ به “۵ روش آسان برای ساخت هوش مصنوعی شخصی خودتان”

  1. توحید گفت:

    سلام وقتتون بخیر
    با تشکر از پیگیری و پاسخهای ارزنده ی شما و مقاله ی خوبی که گذاشتید
    میخواستم برای یه پروژه ی دستیار هوش مصنوعی از reading_comprehension_tf-master و ادغام و اجرای دستیارهایی که معرفی نمودید استفاده کنم ، یمقدار به مشکل برخوردم .
    چطور میتونم برای این مورد و به صورت کلی تر دستیارهای digital human بر مبنای انجین unity و unreal
    (به صورت یه کار ترکیبی) متخصصان با این محوریت رو برای راهنمایی و حتی انجام پروژه پیدا کنم ؟
    توی نت سرچ کردم و سایتای فریلنسر هم دیدم ولی بهتر دیدم از شما کسب اطلاع کنم
    با تشکر از شما و سایت خوبتون

    • مهدی نظری گفت:

      سلام دوست عزیز، لطف دارید.

      اگه به دنبال همکاران ایرانی هستید، پیشنهاد می کنم linkedin.com رو بررسی کنید، بر اساس مهارت افراد رو انتخاب کنید و پیام مستقیم بدین.

      با توجه به تجربه که قبلا داشتم، دیدگاه خوبی نسبت به سایتای فریلنسر ایرانی ندارم (از دیدگاه فریلنسر البته، شاید از دیدگاه کارفرما خوب باشن).

  2. Ali گفت:

    الان چون قصد دارم هر چه سریع تر دیتاست رو درست کنم به نظر شما برای متن و صوت مربوط به آن متن از کدام استفاده کنم بهتر و مناسب تر این نوع دنیاست است؟؟

    • مهدی نظری گفت:

      فکر کنم منظورتون سیستم مدیریت دیتابیس، برای ساخت دیتاست هست.

      به نظر من شما با فایل فرمت csv شروع کنید. سیستم های مدیریت دیتابیس، دستور های خاصی دارن که یکم زمان لازم دارید برای یادگیریشون. البته ORM هم موجود هست و سینتکس اصلی این سیستم ها رو لازم نیست که بدونید، ولی حداقل کارکردشون رو باید درک کنید.

  3. Ali گفت:

    برای برنامه نویسی پایتون که دیتاست رو باید با آن پر کرد ، باید از فریمورک یا کتابخانه خاصی استفاده کرد؟؟

    • مهدی نظری گفت:

      پایتون خودش یه کتابخونه داخلی برای کار با csv داره که با import csv می تونید ازش استفاده کنید. همین طور numpy هم کتابخونه خوبیه که قابلیت خوندن نوشتن csv رو داره.

  4. Ali گفت:

    یعنی برای دیتاست موردنظرم که شامل متن و صوت همان متن هست هم باید از فرمان csv استفاده کنم؟
    این فرمت مربوط به چه نظرم افزاری است ؟
    یعنی باید از چه نرم افزاری استفاده کنم؟

    • مهدی نظری گفت:

      فعلا برای شروع از csv استفاده کنید. در آینده کم کم کار با دیتابیس منیجر ها رو مد نظرتون قرار بدید. نمی دونم پروژه تون چطوری ممکنه پیش بره، سیستم های مدیریت دیتابیس مختلفی وجود دارن که توی شرایط مختلف می تونن مناسب باشن. برای دیتابیس های No SQL یا SQL

  5. Ali گفت:

    با سلام خدمت شما، من برای ساخت دیتاست باید باید با چه برنامه ایی دیتاست مورد نظر رو درست کنم؟
    اگر توضیح بدید که با چی من باید دیتاست را بسازم ممنون میشم؟
    در واقع می خوام بدونم اکر قراره خودم بسازم باید از چی استفاده کنم ؟
    اگر یادتون باشه برای ساخت صدای مصنوعی که قبلا خدمتتون عرض کردم ، هدفم برای ساخت دیتاست صوتی و متن آن می باشد که می خوام بدونم برای ساخت دیتاست از باید از چی استفاده کنم ؟ ممنون میشم توضیح دقیقی بدید تا مطلع بشم

    • مهدی نظری گفت:

      سلام دوست عزیز، من معمولا برای ساخت دیتاست از فرمت csv به صورت comma separated (جدا شده با کاما) استفاده می کنم. با برنامه نویسی پایتون دیتاست رو پر می کنم اول (راه های مختلفی هست برای پر کردن دیتاست، مثلا دستی وارد کنید). شما هم همین کارو باید انجام بدید (با برنامه نویسی).

      مثلا این لینک رو توی گیتهاب ببینید، یه دیتاست csv هست از ویژگی های نژاد های مختلف گل زنبق:

      لینک گیتهاب

  6. Ali گفت:

    با سلام خدمت شما،می خواستم بدونم که pycharm از
    TensorFlow پشتیبانی میکنه یا نه؟
    سوال بعدی هم اینکه برای کار با هوش مصنوعی TensorFlow بهتره یا scikit learn؟

    • مهدی نظری گفت:

      سلام، pycharm یه IDE هست، یعنی محیط برنامه نویسی. بعد از نصب Tensorflow با کد import tensorflow می تونید توی اسکریپت پایتون واردش کنید.

      sci-kit learn برای یادگیری ماشینی خوبه (Machine Learning)، تنسورفلو برای یادگیری عمیق (Deep Learning)

  7. کارزاری گفت:

    اقا سلام خسته نباشید . من میخوام یه هوش مصنوعی باشه که درواقع طبق تصاویر دستور بگیره … یعنی وقتی یه تصویری بهش نشون داده بشه یک سری فرمان هارو اجرا کنه … درواقع میخوام برای بازی هام ربات بزارم

    • مهدی نظری گفت:

      سلام، قراره خود هوش مصنوعی از محیط بازی اطلاعات جمع کنه (با پاداش یا مجازات)، یا می خواید بر اساس بازی انجام شده توسط افراد دیگه تمرین داده بشه؟

      • آرش گفت:

        توسط افراد دیگه منم همین شوال رو دارم

        • مهدی نظری گفت:

          سلام دوست عزیز، تمرین دادن هوش مصنوعی بر اساس بازی بقیه روش ساده تری هست نسبت به اینکه خود هوش مصنوعی از محیط بازی اطلاعات جمع آوری کنه. برای تمرین دادن بر اساس بازی بقیه، شما باید یه دیتابیس ایجاد کنید از تمامی دستور هایی که کاربران بازی وارد کردن (جهت ها، دکمه های عملیات و …) و در نهایت میزان پاداش دریافت شده رو به صورت عددی یا استیت مشخص توی یه ستون دیتابیس وارد کنید. مدل هوش مصنوعی رو در نهایت بر اساس این دیتابیس می تونید تمرین بدین (از پروژه های ساده یادگیری ماشینی محسوب می شه).
          روشی که مدل هوش مصنوعی رو بر اساس تجربه خود هوش مصنوعی در محیط بازی تمرین بدین، بهش reinforcement learning می گن که توی این کامنت کامل توضیح دادم:

          لینک کامنت

  8. Ali گفت:

    با تشکر از تمامی پاسخ هاتون

  9. Ali گفت:

    پس امکان همکاری و کار کردن و کمک گرفتن از شما موجود نیست؟

    • مهدی نظری گفت:

      نه متاسفانه مستقیما نمی تونم در خدمتتون باشم، ولی اینجا کامنت بذارید پاسخ می دم. البته ممکنه سرم شلوغ باشه یکم دیر پاسخ بدم.

      از خوبی های اینکه کامنت بذارید اینجا اینه که بقیه هم ممکنه سوالات مشابه داشته باشن، به جواب برسن.

  10. Ali گفت:

    راهی برای ارتباط با شما به غیر از این سایت نیست ؟
    تا در صورت امکان ،بشه با شما در ارتباط بود و حتی همکاری کرد؟

  11. Ali گفت:

    با تشکر از شما،می خواستم بدونم شما تا به حال پروژه ایی مشابه این که بنده عرض کردم فعالیت داشتید؟

    • مهدی نظری گفت:

      نه تا الان فعالیت نکردم توی پروژه مشابهی. شاید یه موقع بعدا تصمیم گرفتم پروژه text to speech رو به صورت آموزشی بذارم. ولی فعلا وقت نمی کنم.

  12. Ali گفت:

    ببخشید،فقط برای بخش دیتاست که عرض کردید باید از TensorFlow استفاده کنم ؟

    • مهدی نظری گفت:

      دیتاست درواقع حاوی اطلاعاتی هست که شما برای تمرین مدل هوش مصنوعی مورد استفاده قرار می دید (ربطی به تنسورفلو نداره). درواقع یه دیتابیس هست که هر رکورد رو با خصوصیت هاش درون خودش داره. معمولا از فرمت csv برای ذخیره دیتاست استفاده می کنن ولی خب فرمت های دیگه ای هم می تونه داشته باشه دیتاست.

  13. Ali گفت:

    با تشکر از شما بابت پاسخ هایی که دادید

  14. Ali گفت:

    اگه امکانش هست به دو دیدگاه آخرم هم جواب بدید خیلی لطف میکنید

  15. Ali گفت:

    با توجه به اینا به نظر شما کاری که باید انجام بدم برای دیتاست و چیزهای مربوط به آن از کجا باید شروع کنم
    ممنون میشم در این رابطه راهنمایی کنید ؟؟

    • مهدی نظری گفت:

      توی همون کامنت توضیح دادم، می تونید از کتاب های صوتی استفاده کنید. یا خودتون متن بنویسید و بخونید. همین طور در مورد نحوه تبدیل صدا به دیتای قابل ذخیره به صورت text تحقیق کنید (spectrogram).

  16. Ali گفت:

    درباره زبان پایتون که گفتید ،چند ماه هست در حال آموزش و تمرین هستم و الان هم هنوز در حال تمرین هستم برای تسلط بیشتر
    درباره هوش مصنوعی و یادگیری های ماشین و یادگیری عمیق هم که آموزش هایی از آنها تهیه کردم و به همین زودی ها تمرکز بیشتری برای آن ها میذارم
    فقط میمونه شناخت انواع روش تمرین هوش مصنوعی(الگوریتم های مختلف که عرض کردید)
    و یادگیری نحوه کار با تنسورفلو (یا SciKit Learn)

    پس اگه تمام این موضاعات که عرض کردید رو که همانطور که گفتم چند موردش رو گذروندم یاد بگیرم ، میتونم این پروژه رو شروع به کار کنم؟

  17. Ali گفت:

    شما عرض کردید که برای این پروژه نیاز به دونستم پیش نیاز های زیادی هست،میتونم بپرسم چه پیشنیازهایی نیاز هست؟

    • مهدی نظری گفت:

      اول از همه پایتون برای برنامه نویسی که خودش زمان بر هست، بعد درک نحوه عمل کرد هوش مصنوعی با شناخت موارد پایه مربوط به یادگیری ماشینی و یادگیری عمیق، و شناختن انواع روش های تمرین هوش مصنوعی (الگوریتم های مختلفی وجود دارن که باید یاد بگیرید، بعضی موارد رو مختصر توضیح دادم توی کامنتا، بررسی کنید کامنت های قبلی رو). در نهایت یادگیری نحوه کار کردن با تنسورفلو (یا SciKit Learn)

      هر کدوم از مواردی که گفتم چالش هایی دارن که در حین یادگیری باهاشون برخورد می کنید.

  18. Ali گفت:

    به طور کلی من می خوام بدونم میشه مانند
    LYREBIRD و Resemble(که خودتون در توضیحات گقتید) عمل کنم و همین موتور رو با تبدیل هر متن دلخواه به صدای هر شخص با زبان فارسی با همان کیفیت خوب LYREBIRD و Resemble طراحی کنم ؟
    به نظر شما امکان پذیر هست؟؟

    • مهدی نظری گفت:

      امکان پذیر که قطعا هست، ولی خب همین طور که گفتم کار آسونی برای ساخت دیتاست ندارید.

  19. Ali گفت:

    حق با شماست،من از همون موقع که ایده ی مورد نظر در ذهن داشتم و متوجه شدم برای تکمیل اپلیکیشن که قراره طراحی کنم به این موتور با این ویژگی هایی که خدمتتون عرض کردم نیاز دارم ،متوجه شدم که کار سنگینی می باشد ،ولی به نظر شما چقدر طول می کشه که بتونم این موتور رو با بهترین کیفیت صدا و تبدیل متن به صدای هر شخصی انجام دهم؟؟

    • مهدی نظری گفت:

      جواب این سوال مشخص نیست، بستگی داره به سرعت یادگیری و توانایی حل مسائل خودتون

  20. Ali گفت:

    یعنی اصلا نمیشه کاری کرد؟؟

  21. Ali گفت:

    ببخشید،شما گفتید کیفیت خروجی صدا برای زبان فارسی پایین میشه،یعنی هیچ راهی نداره که مثل زبان انگلیسی کیفیت خروجی صدا خوب باشه؟؟

    • مهدی نظری گفت:

      از نظر ذات زبان فارسی گفتم. خوندن مضاف و مضاف الیه، همین طور تشدید توی کلمات چالش برانگیز هستن. شاید بتونید تکنیک هایی استفاده کنید یا با دیتاست کامل تری مدل رو تمرین بدین که بهتر کنه کیفیت خوندن متن رو.

  22. Ali گفت:

    من هدفم شبیه ساز صدای دیجیتال هر شخصی برای زبان فارسی می باشد که بعد هر منتی نوشته میشه با صدای آن شخص پخش بشه
    برای ساخت این موتور میشه از هوش مصنوعی استفاده کرد و نتیجه گرفت؟
    (فقط احتمال زیاد قصدم این هست که ورودی بر اساس صداهای ضبط شده باشه)

    • مهدی نظری گفت:

      در کل طبق اون نکاتی که گفتم شما کار راحتی در پیش ندارید، ولی خب هوش مصنوعی تنها راه حل شماست. راه حل دیگه ای وجود نداره.

      شما باید تمرکز رو بذارید روی بخش تبدیل متن به صدا (جدا از مسئله صدای ضبط شده و …)، در واقع باید نرم افزاری بسازید که یه متن تایپ شده رو تبدیل به صوت کنه، این قسمت چالش اصلی سیستم هست چون تبدیل صدا به متن فارسی در حال حاضر وجود داره (مثل speech-to-text گوگل که روی اندروید می بینید).

      برای تمرین دادن مدلی که بتونه متن رو به صوت تبدیل کنه، شما نیاز به دیتاست بزرگی دارید که درواقع باید فایل صوتی خوندن یه متن باشه (شما هم متن رو لازم دارید، هم فایل صوتی رو). می تونید از کتابای صوتی استفاده کنید برای این قسمت از کار، ولی خب همیشه متن اصلی کتاب و صدا در کتاب های صوتی همراستا نیستن، باید تکنیک هایی رو استفاده کنید که بتونید مشخص کنید کجای متن به کجای فایل صوتی مرتبط می شه (احتمالا باید خودتون زحمت برش فایل صوتی و کپی متن رو بکشید، کار ساده ای هم نخواهد بود، هر از چند ثانیه یه برش نیاز دارید).

      در نهایت شما باید مدل رو از دیتاستی تمرین بدید که شامل متن کتاب و بیت های فایل صوتی باشه.

      در کل همون پیشنهادی که داشتم بهتون رو مدل نظر داشته باشید، بهتره با پروژه های ساده تر شروع کنید، شما دارید از مرحله آخر کار شروع می کنید.

  23. Ali گفت:

    من هدفم شبیه ساز صدای دیجیتال هر شخصی برای زبان فارسی می باشد که بعد هر منتی نوشته میشه با صدای آن شخص پخش بشه
    برای ساخت این موتور میشه از هوش مصنوعی استفاده کرد و نتیجه گرفت
    (فقط احتمال زیاد قصدم این هست که ورودی بر اساس صداهای ضبط شده باشه)

  24. Ali گفت:

    من مدتی هست که قصد داشتم این سوالات رو بپرسم و وقتی دیدم که دارای تجربه هستید و خیلی عالی جواب سوالات رو میدید ، بنابر این خواستم از یک فرد مجرب سوالاتمو بپرسم،خیلی از جواباتون که به بنده دادید ممنونم ولی ممنون میشم که توضیحات بیشتری به بنده بدید و مطمئن باشید قصد هیچ سو استفاده ایی نیست و همانطور که قبلا هم عرض کردم حتی میتونه یک اپلیکیشن نوین و مفید باشه که با اطلاعی که دارم حتی در جهان هم ممکنه موجود نباشه ، پس ممنون میشم بیشتر توضیح بدید

    • مهدی نظری گفت:

      به سری نکات:

      ۱- تکنولوژی clone کردن صدا به صورت realtime، در اکثر موارد فرایند تبدیل صدا به متن، و تبدیل دوباره متن به صدا با تن صدای شخص مورد نظر هست
      ۲- با زبون انگلیسی می تونید api هایی رو پیدا کنید که با هزینه (نه چندان پایین) اجازه clone کردن صدا رو می دن (دردسر برنامه نویسی ندارید، ولی خب همه زبون ها رو پشتیبانی نمی کنن) نمونه: https://www.resemble.ai
      ۳- با زبون فارسی کار سختی در پیش دارید
      ۴- از جستجوی github کمک بگیرید: https://github.com/topics/voice-cloning
      ۵- کیفیت تبدیل text به صدا خوب نخواهد شد (مخصوصا زبان فارسی)
      ۶- اگه شروع کارتون با هوش مصنوعی هست، دارید از پروژه خیلی خیلی سختی شروع می کنید که نیاز به دونستن پیشنیاز های خیلی زیادی داره، اول با ساده ترین پروژه ها شروع کنید.

  25. Ali گفت:

    خواهش میکنم سو تفاهم نشه، این اپلیکیشنی که قرار است بنده طراحی کنم قرار نیست هیچ گونه سو استفاده ایی رخ دهد بلکه می تونه یک اپلیکیشن نوین و مفید برای کاربران باشه ، ممنون میشم لطف کنید و اطلاعات بیشتری در رابطه با این موتور که قرار است طراحی کنم و چگونگی استفاده از هوش مصنوعی مربوط به آن به من بدید

  26. Ali گفت:

    در ادامه سوال هم باید عرض کنم که هدف من تبدیل هر متنی به آن صدای دیجیتال هر شخص میباشد
    به نظر شما می تونم با تمام این گفته ها از هوش مصنوعی برای طراحی این موتور کمک بگیرم و آن را در ساخت اپلیکیشن استفاده کنم؟

    • مهدی نظری گفت:

      بله از هوش مصنوعی می تونید استفاده کنید، مسئله حل شده ای هست، ولی خب پیشنهاد می کنم در مورد مسائل قضایی همچین کاری بیشتر تحقیق کنید.

  27. Ali گفت:

    با تشکر از شما ، من قصد دارم اپلیکیشنی رو طراحی و درست کنم که اولویت اول برای ساخت این اپلیکیشن نیاز به صدای دیجیتال می باشد ، یعنی شبیه سازی صدای هر انسان که حداقل ۷۰ تا ۸۰ درصد به صدای واقعی آن شخص نزدیک باشه ، برای همین گفتم از هوش مصنوعی استفاده کنم تا بتونم این موتور برای استفاده در اپلیکیشنی که قرار است طراحی کنم استفاده کنم ، خواستم از شما در این رابطه سوال کنم که می تونم این موتور شبیه ساز صدای هر شخص رو با کمک هوش مصنوعی طراحی کنم و در اپلیکیشن که قراره درست کنم استفاده کنم ؟

    • مهدی نظری گفت:

      به این تکنولوژی voice cloning می گن، کتابخونه های پایتونی وجود دارن که این کار رو انجام می دن، ولی از اونجایی که این قابلیت هوش مصنوعی می تونه مورد سوء استفاده قرار بگیره متاسفانه نمی تونم بیشتر در موردش توضیح بدم.

  28. Ali گفت:

    سلام ،ببخشید من یک سوال داشتم که می خوام ببینم کی جواب میدید که بپرسم

  29. امیر علی ثباتی گفت:

    سلام .
    ممنون از مطالب خوبتون .
    من کمنت ها رو که خوندم متوجه شدم که شما واقعا بلد هستید و بر خلاف بسیاری جاهای دیگه صرفا یک مطلب منتشر نکرده اید .
    من خواستم بپرسم که الگوریتم فلوچارت رو از کجا میتنم یاد بگیرم ؟
    می خواهم برنامه نویسی را شروع کنم .
    پدر من یکی ز بزرگترین برنامه نویسان ایران هستند .
    البته احتمالا اسمشان را نشنیده اید .
    ولی بهر حال ایشان به من گفتند که باید ابتدا الگوریتم فلوچارت را یاد بگیرم . و پیشنهاد کردند که اول زبان C را یادبگیرم . چون این زبان برای این ساخته شده است که فکر ما آنطور که باید شکل بگیرد .
    خود ایشان به خاطر مشغله های زیادشان فرصت نمی کنند که به من الگورتم فلوچارت را یاد دهند .
    ————————————
    با تشکر ـ امیر علی ثباتی

    • مهدی نظری گفت:

      سلام امیر علی عزیز، می بخشید که دیر پاسخ دادم، یک ماه اخیر درگیر پروژه های مختلفی بودم.

      فلوچارت از پایه ترین مواردی هست که شما باید یاد بگیرید، توی دانشگاه هم اوایل درس مبانی فلوچارت رو آموزش می دن که بخش ساده ای از درس مبانی هست. هر کتابی رو پیدا کنید که توی دانشگاه تدریس می شه برای درس مبانی این بخش رو داره. پیشنهاد می کنم البته یه جستجو توی گوگل انجام بدید چون فلوچارت چندان مفهوم پیچیده ای نیست و سریعا یاد می گیرید (البته جنبه آموزشی داره، برنامه نویسی رو ندیدم که زمان بذاره فلوچارت بکشه برای کدهاش).
      پیشنهاد می کنم زیاد روی C زمان نذارید اگه قصد دارید برای برنامه نویسی رو برای هوش مصنوعی یاد بگیرید. البته شخصا حدود ۱۲ سال پیش با C++ شروع کردم برنامه نویسی رو، ولی خب سال هاست C++ ننوشتم. خیلی زبان پایه ای هست، معمولا زمان نوشتن یه اپلیکیشن با C++ خیلی بیشتر از زبان هایی مثل پایتون یا جاواست. پیشنهاد می کنم با پایتون شروع کنید، سینتکس (نحوه نگارش) خیلی ساده تری داره و کاربردی تر هست.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دسته بندی
بستن