PDA

View Full Version : استخراج متن از تصویر (عکس)



پرستو پارسایی
چهارشنبه 10 آبان 1402, 20:01 عصر
برای استخراج متن از تصاویر یا عکس باید از تکنیکی به نام Optical Character Recognition (OCR) استفاده کنیم با اضافه کردن کتابخانه Tesseract OCR از NuGet و با کد زیر میتونیم متن رو استخراج کنیم

Imports System.Drawing
Imports Tesseract


Public Class Form1
Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
' مسیر فایل عکس را وارد کنید
Dim imagePath As String = "path_to_image.jpg"


' تشکیل شیء تشخیص متن با استفاده از Tesseract OCR
Using engine As New TesseractEngine("./tessdata", "eng", EngineMode.Default)
Using img As Pix = Pix.LoadFromFile(imagePath)
Using page As Page = engine.Process(img)
' استخراج متن از عکس
Dim extractedText As String = page.GetText()


' نمایش متن در TextBox
TextBox1.Text = extractedText
End Using
End Using
End Using
End Sub
End Class

مهدی کرامتی
چهارشنبه 10 آبان 1402, 21:32 عصر
تزراکت ابزار بسیار خوبی است، اما برای دریافت خروجی بهینه از آن میبایست فایل های زبان موجود آن (از جمله فارسی) را با آموزش بهبود دهید، زیرا در اکثر حالت ها مانند زاویه دار بودن متن، پس زمینه نویز دار و ... خوب عمل نمی کند.

نمونه ای که بنظر میاد این فایل های زبان را تا حد خوبی به تزراکت آموزش داده سایت متن یار (https://matnyaar.ir) می باشد.