PDA

View Full Version : پردازش صوت ( ایجاد فرمانهای صوتی ) ...



Mahmood_M
دوشنبه 16 بهمن 1385, 13:45 عصر
سلام
می خواستم در مورد چگونگی پردازش صوت و ایجاد فرمانهای صوتی بدونم ...
فرض کنید با پخش یک صدایی یک دستور اجرا بشه ( پخش صدا با میکروفون ) ...
اگه الگوریتم خاصی داره یا کلا روش کار رو اگه توضیح مختصری در موردش بدید ممنون می شم ...
با تشکر ...

babak_delphi
سه شنبه 17 بهمن 1385, 02:31 صبح
تا جایی که من میدونم اول باید اون کلمات رو با تن صداهای مختلف ضبط کنی
مثلا 20 جور OPEN
بعد موقع اجرا از کاربر بخای که چنتا کلمه رو بگه و اونارو با اطلاعات خودت مقایسه کنی و ببینی که به کدوم دسته شبیه تره
مثلا بگه OPEN و ببینی به کدوم یک از OPEN هایی که قبلا ضبط کردی شبیه تره
برایی این کار چند تا کلمه رو تست کن
بعد که دستهء مورد نظر مشخص شد شرو کن
هروقت کلمه ای رو تلفظ کرد ، اونو با کلمات دستهء مورد نظر مقایسه کن
اگه هم خونی داشت ، دستور متناظرش رو اجرا کن.

حرفه ای
سه شنبه 17 بهمن 1385, 08:27 صبح
سلام
می خواستم در مورد چگونگی پردازش صوت و ایجاد فرمانهای صوتی بدونم ...
فرض کنید با پخش یک صدایی یک دستور اجرا بشه ( پخش صدا با میکروفون ) ...
اگه الگوریتم خاصی داره یا کلا روش کار رو اگه توضیح مختصری در موردش بدید ممنون می شم ...
با تشکر ...

دوست خوبم :لبخندساده:

راستش من یک کمی در این خصوص کار کردم ، برنامه های مشابه خارجی زیادی وجود داره که از این خاصیت استفاده کردند که ساده ترینشSpeach to text مایکروسافته
اما فارسی بسیار سخت تره
مسئله حروف ، هجی ها ، لحن ها و ... حتی لحجه ها متنوع تره
دوستمون یک پیشنهاد داد میشه گفت غیر قابل استفاده است چون خیلی کم پیش می آید که کلمی مثل Open را ما دوبار شبیه هم بگوییم ، در استرس ، شادی و ... لحن صدای ما عوض می شود
اینجا دیگر مسئله هوش مصنوعی و شبکه های عصبی و هزاران فرمول ریاضی پیچیده مطرح است که نیازمند گروه برنامه نویس حرفه ای و متبحر است
امید است ما روزی به آنجایی برسیم که Speach ToText فارسی داشته باشیم :چشمک:

SuperElectric
جمعه 18 اسفند 1385, 12:03 عصر
امید است ما روزی به آنجایی برسیم که Speach ToText فارسی داشته باشیم
سلام
http://www.asr-gooyesh.com/farsi/index.asp
این گروه از بچه های شریف هستن و چند سالی هست که دارند کار میکنن و به یه جاهایی هم رسیدن