PDA

View Full Version : گوگل - کاتالوگ



.Taher
شنبه 21 شهریور 1383, 14:59 عصر
سلام
تا به حال به قسمت کاتالوگهای گوگل (http://catalogs.google.com/ ) سر زده اید؟

نکته جالب توجه سرچ در عکس هاست! (مثلا http://catalogs.google.com/catalogs?q=pc+quest&btnG=Google+Search)

چطور اینکار رو انجام میدن؟ آیا با توابع built-in امکانپذیره؟

oxygenws
شنبه 21 شهریور 1383, 16:04 عصر
خیلی کارا میشه کرد.
بستگی داره ورودی اونا چی بوده، یعنی این صفحاتی که اینا دارند در کجا قرار داره، آیا متنیش رو هم دارند یا خیر و ... آیا کاتالوگ هایی که اونجا هست، احتیاج به عضویت دارند؟!! یا جدی گوگل می ره خودش می گرده؟!!

شاید اولین چیزی که به ذهن من می رسه:
۱- یک بار OCR کردن عکس ها و ذخیره کردن اطلاعات عکس، کلماتش و موقعیت این کلمات در بانک.
۲- پس از جستجو، بازیابی فلان کلمه و نشان دادن عکس edit شده برای کاربر.

موفق باشید، امید

.Taher
شنبه 21 شهریور 1383, 22:14 عصر
خیلی کارا میشه کرد.
بستگی داره ورودی اونا چی بوده، یعنی این صفحاتی که اینا دارند در کجا قرار داره، آیا متنیش رو هم دارند یا خیر و ... آیا کاتالوگ هایی که اونجا هست، احتیاج به عضویت دارند؟!! یا جدی گوگل می ره خودش می گرده؟!!

شاید اولین چیزی که به ذهن من می رسه:
۱- یک بار OCR کردن عکس ها و ذخیره کردن اطلاعات عکس، کلماتش و موقعیت این کلمات در بانک.
۲- پس از جستجو، بازیابی فلان کلمه و نشان دادن عکس edit شده برای کاربر.

موفق باشید، امید

یعنی این همه صفحه رو میاد پردازش کنه؟خودش کار آسونی نیست... حداقلش کلی وقت میگیره... نه؟
جالب اینه که با چه دقتی در عکس نوشته رو پیدا میکنه... یعنی مختصات دقیقش رو داره!

یا شاید هم به قول شما اطلاعات رو ذخیره داره ، در اینصورت چه نیازیه که دوباره به عکس تبدیل بشن؟

اونطور که خودش گفته :



Google Catalog Search applies Google's sophisticated search technology to thousands of scanned mail-order catalogs, from industrial adhesives to designer clothing and gourmet food. Whether you publish business or consumer catalogs, Google Catalog Search extends the reach of your marketing efforts to millions of new customers.

ورودیشون هم عکس ماننده!!

خلاصه، این گوگول مشکوک میزنه :D

oxygenws
شنبه 21 شهریور 1383, 23:34 عصر
یعنی این همه صفحه رو میاد پردازش کنه؟خودش کار آسونی نیست... حداقلش کلی وقت میگیره... نه؟
همچین کار سختی برای گوگل نیست :) فرض کنید هر صفحه چیزی حدود ۱ دقیقه طول بکشه (که خیلی زیاده) و در آن واحد ۶۰ صفحه پردازش بشه :) یعنی در هر ثانیه یک صفحه!!! یعنی روزانه چیزی حدود 1440 نشریه ۶۰ صفحه ای :)


جالب اینه که با چه دقتی در عکس نوشته رو پیدا میکنه... یعنی مختصات دقیقش رو داره!
مشخصات در آوردن از اینکه بفهمه اونجا دقیقا چی نوشته سخت تره. یعنی اینکع مختصات مهم نیست. این مهمه که گوگل اینقدر دقیق (و مطمئن از بررسی خودش) صفحات رو در معرض دید عموم می ذاره.


یا شاید هم به قول شما اطلاعات رو ذخیره داره ، در اینصورت چه نیازیه که دوباره به عکس تبدیل بشن؟
یک بار فقط یک عکس ذخیره می شه ولی تمام کلمات داخل اون صفحه نیز ذخیره می شه. البته به همراه مختصات اون.
بعد وقتی شما فلان کلمه رو جستجو می کنید. میاد بخشی از اون رو زرد می کنه (اینجاست که گوگل دوباره عکس رو میسازه) و به شما نشون می ده.

در آخر هم بگم که....
اینهایی که من می گم فقط و فقط نظر های خام و احمقانه من هستش، هیچ دلیلی نداره گوگل هم همین کارا رو بکنه!!!!!!! :P

موفق باشید، امید

houtanal
یک شنبه 22 شهریور 1383, 00:37 صبح
تا جایی که می دونم سیستم فایل گوگل کلا با سیستم های عادی متفاوت است(همش رمه!) در ضمن مثل اینکه زبان برنامه نویسیش phyton است.

.Taher
یک شنبه 22 شهریور 1383, 00:48 صبح
یعنی این همه صفحه رو میاد پردازش کنه؟خودش کار آسونی نیست... حداقلش کلی وقت میگیره... نه؟
همچین کار سختی برای گوگل نیست :) فرض کنید هر صفحه چیزی حدود ۱ دقیقه طول بکشه (که خیلی زیاده) و در آن واحد ۶۰ صفحه پردازش بشه :) یعنی در هر ثانیه یک صفحه!!! یعنی روزانه چیزی حدود 1440 نشریه ۶۰ صفحه ای :)

یاد اون معمای پختن تخم مرغ افتادم!
صحبت شما تا حدودی منطقیه... (من حواسم نبود گوگل چند تا کامپیوتر میتونه داشته باشه) با این حال باز بعیده... توی مجله ها اونقدر نوشته های شیب دار، کوچک بزرگ و... هست که پردازشگر رو فیتیله پیچ کنه....




جالب اینه که با چه دقتی در عکس نوشته رو پیدا میکنه... یعنی مختصات دقیقش رو داره!
مشخصات در آوردن از اینکه بفهمه اونجا دقیقا چی نوشته سخت تره. یعنی اینکع مختصات مهم نیست. این مهمه که گوگل اینقدر دقیق (و مطمئن از بررسی خودش) صفحات رو در معرض دید عموم می ذاره.

تازه در سه سایز مختلف! یعنی فکر نکنم با مختصات بشه جورش کرد... یه دریا عدد میشه...




یا شاید هم به قول شما اطلاعات رو ذخیره داره ، در اینصورت چه نیازیه که دوباره به عکس تبدیل بشن؟
یک بار فقط یک عکس ذخیره می شه ولی تمام کلمات داخل اون صفحه نیز ذخیره می شه. البته به همراه مختصات اون.
بعد وقتی شما فلان کلمه رو جستجو می کنید. میاد بخشی از اون رو زرد می کنه (اینجاست که گوگل دوباره عکس رو میسازه) و به شما نشون می ده.

آخه ساختن این عکس ها با فتوشاپ مشکله، چه برسه داینامیک! هزار نوع فونت، بالا پایین، کج و راست و ... و ...



در آخر هم بگم که....
اینهایی که من می گم فقط و فقط نظر های خام و احمقانه من هستش، هیچ دلیلی نداره گوگل هم همین کارا رو بکنه!!!!!!! :P

موفق باشید، امید

من هم انتظار ندارم که شما سورس کد گاگول رو بذارید :wink:
همین طوری چیزهایی مفیدی هم دستگیر ما میشه....

ممنونم.

oxygenws
یک شنبه 22 شهریور 1383, 13:29 عصر
یاد اون معمای پختن تخم مرغ افتادم!
صحبت شما تا حدودی منطقیه... (من حواسم نبود گوگل چند تا کامپیوتر میتونه داشته باشه) با این حال باز بعیده... توی مجله ها اونقدر نوشته های شیب دار، کوچک بزرگ و... هست که پردازشگر رو فیتیله پیچ کنه....
خوب آیا تا حالا دیدی که گوگل یک نوشته شیب دار رو هم پیدا کنه؟؟؟


آخه ساختن این عکس ها با فتوشاپ مشکله، چه برسه داینامیک! هزار نوع فونت، بالا پایین، کج و راست و ... و ...
گذاشتن یک کادر زرد رنگ از فلان مختصات تا فل مختصات کار سختیه؟؟

ممنون

.Taher
یک شنبه 22 شهریور 1383, 17:10 عصر
البته من منظورم چیز دیگری بود. مثلا فرض می کردم که گوگل نوشته ها رو دوباره کنار هم میگذاره و دوباره صفحه رو میسازه!!!(یکم تخیلی فکر میکردم) ولی گویا فقط یک overlay ساده انجام میده...

چند تا مورد پیدا کردم که پردازش این تصاویر رو به گونه ای اثبات میکنه...

http://catalog.google.com/catalogs?q=googlr&btnG=Google+Search&hl=en&lr=&ie=UTF-8

http://catalog.google.com/catalogs?hl=en&lr=&ie=UTF-8&q=g00gle&btnG=Google+Search


به فرض هر صفحه 300 تا 800 تا کلمه داشته باشه... (متوسط 500) - میشه گفت هر کلمه 3 تا مختصات داره (با توجه به سه زوم مختلف)... یعنی همراه هر صفحه حداقل 6000 عدد باید ذخیره بشه (که اونقدرها هم زیاد هم نیست)

خوب بریم یه گوگلی بزنیم تا این بتا-ش نسخه پایانی نشده (پیش دستی کنیم! :wink: )

oxygenws
یک شنبه 22 شهریور 1383, 18:35 عصر
به فرض هر صفحه 300 تا 800 تا کلمه داشته باشه... (متوسط 500) - میشه گفت هر کلمه 3 تا مختصات داره (با توجه به سه زوم مختلف)... یعنی همراه هر صفحه حداقل 6000 عدد باید ذخیره بشه (که اونقدرها هم زیاد هم نیست)
نه بابا، هنوز هم تخیلی فکر می کنی :) برای هر کلمه فقط کافیه ۴ مختصات (x1 , y1 , x2 , y2) رو ذخیره کنه. بعد در اون عکسی که زوم نشده، با یه محاسبه ریاضی ساده، این مستطیل رو بزرگ تر نشون بده‌ :wink:

موفق باشید

.Taher
یک شنبه 22 شهریور 1383, 20:30 عصر
:wink:
پس با این حساب 4000 عدد به نفع گوگل... :mrgreen:

ممنونم...