saeedhushmand
چهارشنبه 31 خرداد 1391, 21:30 عصر
من در حال تحقیق در مورد speech to text هستم
"استفاده از روش حرف به حرف نه از روش بانک اطلاعاتی"
یکی از دوستام گفت روی اسپکتروگرام کار کن (نمایش وضعیت فرکانس هر حرف: در این روش تعداد ناحیه هر حرف و بازه فرکانس نمایش داده می شه، و با فرکانس هر حرف و تعداد ناحیه هاش بشه هر حرفو تشخیص داد)
البته به نظر من این روش هم درست نیست و مشکلات زیادی داره
"تشخیص حروف مشابه مثل "ت،ط"بسیار کار مشکلی یک جورایی بعید ...
امکان خطا با عوض شدن صدای گوینده بسیار بالا می باشد
می خواستم بدونم دوستان روش دیگه ای به جز اسپکتروگرام ، یا همین تشخیص حرف به حرف در ذهن دارند به من کمک کنند...
بعد یک سوال دیگه می خواستم بدونم برنامه ی نویسا از system.speech استفاده کرده یا نه...
و اینکه یکی از دوستام گفت در این برنامه با اضافه کردن کلمه به بانک ، مثلا "سعید" باید تلفظش به انگلیسی وارد کنی("saeed") این حرف درسته یا نه...
"استفاده از روش حرف به حرف نه از روش بانک اطلاعاتی"
یکی از دوستام گفت روی اسپکتروگرام کار کن (نمایش وضعیت فرکانس هر حرف: در این روش تعداد ناحیه هر حرف و بازه فرکانس نمایش داده می شه، و با فرکانس هر حرف و تعداد ناحیه هاش بشه هر حرفو تشخیص داد)
البته به نظر من این روش هم درست نیست و مشکلات زیادی داره
"تشخیص حروف مشابه مثل "ت،ط"بسیار کار مشکلی یک جورایی بعید ...
امکان خطا با عوض شدن صدای گوینده بسیار بالا می باشد
می خواستم بدونم دوستان روش دیگه ای به جز اسپکتروگرام ، یا همین تشخیص حرف به حرف در ذهن دارند به من کمک کنند...
بعد یک سوال دیگه می خواستم بدونم برنامه ی نویسا از system.speech استفاده کرده یا نه...
و اینکه یکی از دوستام گفت در این برنامه با اضافه کردن کلمه به بانک ، مثلا "سعید" باید تلفظش به انگلیسی وارد کنی("saeed") این حرف درسته یا نه...