PDA

View Full Version : speech to text



negarsoft
سه شنبه 01 بهمن 1387, 05:00 قبل از ظهر
سلام اول از همه بگم كه من خيلي دنبال گشتم ولي چيز خوبي گير نياوردم
من يك سورسي مي خوام (زبونش يا c++ متلب)كه گفتار رو به متن تبديل كنه خب اينجاش زياد مشكل نداره (چون نرم افزاري مثل simon كه اوپن سورس هم هست همين كارو مي كنه)ولي من مي خوام كه وابسته به گوينده نباشه (اشكال سيمون همينه)و زباني هم كه بهش مي ديم انگليسي باشه لازم نيست كه بازدهيش 100درصد باشه 50 درصد هم بود قبول البته بگم كه من تا حدودي با مكانيسم شبكه هاي عصبي و مدل مارركوف مخفي و...آشنايي دارم (يعني اگه بخواي 3 4 روز برات مي گم ولي در عمل هيچي ) يك چيز ديگه يكمي توضيح در مورد فايل هدر speech.h در سي پلاس پلاس بدين هم ممنون مي شم

MAiLDEREMi
چهارشنبه 02 بهمن 1387, 02:05 قبل از ظهر
والا نمی دونم ملت با speech.h کار کردن یا نه ولی فکر کنم توی #C و VB یکمی راحتتر هست... البته به شرط اینکه موتور Speech رو از قبل داشته باشیم...
ممکنه به سوال شما ربطی نداشته باشه ولی:
اگه از Speech می خواین که کار سنگینی بکشید، توصیه می کنم از Speech Server استفاده کنید...
این لینک دانلود (http://download.microsoft.com/download/e/3/d/e3d216ee-5bf6-4b7d-ac46-469c407e44a2/SpeechServer.exe) Speech Server هست...
البته زبان های دیگه هم داره:


http://download.microsoft.com/download/e/3/d/e3d216ee-5bf6-4b7d-ac46-469c407e44a2/French%20(France)%20LP.exe
http://download.microsoft.com/download/e/3/d/e3d216ee-5bf6-4b7d-ac46-469c407e44a2/German%20(Germany)%20LP.exe
http://download.microsoft.com/download/e/3/d/e3d216ee-5bf6-4b7d-ac46-469c407e44a2/Italian%20(Italy)%20LP.exe
اگه قصد کار روی Office Speech رو دارید، می تونید هر زبان رو که خاستید از اینجا (http://www.microsoft.com/downloads/details.aspx?FamilyID=bb183640-4b8f-4828-80c9-e83c3b2e7a2c&DisplayLang=en) دانلود کنید...

LP=Language Pack


برای زبان فرانسوی یک سری هم اگه به اینجا (http://www.microsoft.com/DOWNLOADS/details.aspx?FamilyID=360cb6a0-044e-4f76-b777-ecb30886d93c&displaylang=en) بزنید بد نمیشه...
برای زبان فرانسوی یک سری هم اگه به اینجا (http://www.microsoft.com/downloads/details.aspx?FamilyID=227A88DE-8A31-4CA8-B1C2-0EC3B0FC6D95&displaylang=en) بزنید بد نمیشه...

اینم توضیحات دیگه:



Microsoft Speech Application Software Development Kit 1.1
Brief Description
Developers can use the Microsoft Speech Application SDK (SASDK) Version 1.1 to quickly and easily add speech interfaces to Microsoft ASP.NET Web applications. The development tools included in the SASDK support the Speech Application Language Tags (SALT) specification.


صفحه اصلی (http://www.microsoft.com/downloads/details.aspx?familyid=1194ED95-7A23-46A0-BBBC-06EF009C053A&displaylang=en)

برای استفاده از Microsoft Direct Speech می تونید از این فایل (http://download.microsoft.com/download/speechSDK/Install/4.0a/WIN98/EN-US/spchapi.EXE) استفاده کنید...
بعد از نصب (به شکل اتومات) از این آدرس می تونید اون رو پیدا کنید:

c:\WINDOWS\speech\Xlisten.dll


در آخر اینرو بگم که من خودم از پایین ترین ورژن برای کارم (پروژه پایان ترم کاردانی سخت افزار) اسفاده کردم... امیدوارم دوستان توی ورژن های جدید به مشکل نخورن...

negarsoft
یکشنبه 06 بهمن 1387, 06:17 قبل از ظهر
سلام من از لينوكس استفاده مي كنم اگر مي شه يك راه غير ويندوزي يا اپن سورس معرفي كنيد (البته جسارتا")يا يكم بيشتر توضيح بديد(هيچي نفهميدم)
ممنون

pourhabibi
چهارشنبه 02 اردیبهشت 1388, 10:05 قبل از ظهر
سلام.كسي هست كه راجع به تبديل speech به text با مدل ماركوف كاركرده باشه؟ ميشه منو راهنمايي كنين

MAiLDEREMi
یکشنبه 28 تیر 1388, 01:18 قبل از ظهر
توضیحاتی در مورد Text2Speech در لینوکس اینجا (http://www.xenocafe.com/tutorials/php/festival_text_to_speech/index.php) هست...
ولی در مورد Speech2Text بهتره یه سری به اینجا (http://www.syednetworks.com/asterisk-integration-with-sphinx-voice-recognition-system) بزنید.

amir_saniyan
یکشنبه 16 اسفند 1388, 19:43 بعد از ظهر
سلام

فقط می‌خواستم بگم که این سایت رو هم نگاه کنید :)

http://www.asr-gooyesh.com/farsi/pr_dict_persian_overview.asp