درود عزیزان
من دو تا سوال دارم:
اولی
من یکسری لیست رشته ای دارم که عموما فارسی هستند وسط این کلمه ها گاها کاراکتر غیرمرتبط(عدد-علائم نگارشیکاراکتر انگلیسی و...)
فکر می کنم بسته به کیبوردی که طرف داره باهاش داده وارد میکنه میزنه تو داده
که من باید اینها رو مدیریت کنم
مثلا: lمرضیه
با این اسکریپت کد کاراکترها رو درمیارم

select substring(a.b, v.number+1, 1) as 'char' , unicode(substring(a.b, v.number+1, 1)) as code
from (select N'lمرضیه' b) a
join master..spt_values v on v.number < len(a.b)
where v.type = 'P'
الان میخام ببینم کد کاراکتر "l" برای چه زبانی/collation و.. هست مثلا و این رو بتونم با شرط گذاشتن روی کد کاراکتر بکشم بیرون که خروجی بشه داده معتبر
کسی میتونه راهنمایی کنه چه تابعی رو باید استفاده کنم ؟

دومی

تو اسامی وقتی داره جستجو انجام میشه گاهی اسم هست ولی یکی از کد کاراکترهاش متفاوته
مثل ی فارسی و ی عربی
الان من چک کردم دیدم گاهی کلمه هست ولی تو سرچ پیدا نمیشه دیدم بازم کد کاراکتر داریم که ظاهرش همین ی میشه -عملا مشکلی که پیش میاد اینه که کلمه پیدا نمیشه
و من نمیدونم چند تا کد کاراکتر دیگه برای همین حرف یا حروف دیگه با همین ظاهر یکسان هست

select NCHAR(1610) 'ی عربی', NCHAR(1740) AS 'ی فارسی',NCHAR(1609),NCHAR(1574)
الان سوالم این هست که راهی برای بدست آوردن این کد کاراکتر های با ظاهر یکسان هست یا نه
که پروسه سرچ به مشکل نخوره؟
پروسه ای هست که بشه این کد کاراکتر های مشابه رو معادل سازی کرد -سمت دیتابیس(ترجیحا) -یا سمت بک اند و فرانت اند هر کدوم احیانا ایده ای براش دارین ممنون میشم راهنمایی کنید