PDA

View Full Version : هنگ کردن سرور به دلیل....



kusha313
یک شنبه 20 دی 1388, 12:54 عصر
سلام دوستان جایی که من کارمیکنم چندوقته بعضی وقتا سرورش هنگ میکنه این درحالیه که حدودا دو ماه اصلا مشکلی نداشت و اصلا هنگ نمی کرد موقعی که هنگ می کنه باریست شدنش من event viewer رو دیدم که در قسمت replication log اون دقیقا اوقاتی که هنگ کرده بود error زیر مشاهده شد

idcod=13568 source ntfrs
The File Replication Service has detected that the replica set "DOMAIN SYSTEM VOLUME (SYSVOL SHARE)" is in JRNL_WRAP_ERROR.

Replica set name is : "DOMAIN SYSTEM VOLUME (SYSVOL SHARE)"
Replica root path is : "c:\windows\sysvol\domain"
Replica root volume is : "\\.\C (file://\\.\C):"
A Replica set hits JRNL_WRAP_ERROR when the record that it is trying to read from the NTFS USN journal is not found. This can occur because of one of the following reasons.

[1] Volume "\\.\C (file://\\.\C):" has been formatted.
[2] The NTFS USN journal on volume "\\.\C (file://\\.\C):" has been deleted.
[3] The NTFS USN journal on volume "\\.\C (file://\\.\C):" has been truncated. Chkdsk can truncate the journal if it finds corrupt entries at the end of the journal.
[4] File Replication Service was not running on this computer for a long time.
[5] File Replication Service could not keep up with the rate of Disk IO activity on "\\.\C (file://\\.\C):".
Setting the "Enable Journal Wrap Automatic Restore" registry parameter to 1 will cause the following recovery steps to be taken to automatically recover from this error state.
[1] At the first poll, which will occur in 5 minutes, this computer will be deleted from the replica set. If you do not want to wait 5 minutes, then run "net stop ntfrs" followed by "net start ntfrs" to restart the File Replication Service.
[2] At the poll following the deletion this computer will be re-added to the replica set. The re-addition will trigger a full tree sync for the replica set.

WARNING: During the recovery process data in the replica tree may be unavailable. You should reset the registry parameter described above to 0 to prevent automatic recovery from making the data unexpectedly unavailable if this error condition occurs again.

To change this registry parameter, run regedit.

Click on Start, Run and type regedit.

Expand HKEY_LOCAL_MACHINE.
Click down the key path:
"System\CurrentControlSet\Services\NtFrs\Parameters"
Double click on the value name
"Enable Journal Wrap Automatic Restore"
and update the value.

If the value name is not present you may add it with the New->DWORD Value function under the Edit Menu item. Type the value name exactly as shown above.
For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
من هنوز سردرنیاوردم که مشکل چیه و چه جوری حل میشه
از اساتید محترم خواهشمی کنم کمکم کنید من توی اینترنت هم سرچ کردم و سایت راهنمای اون رو پیدا کردم ولی چون زبانم خوب نیست سر در نیاوردم
به نظر شما راه حل چیه؟

hghyami
یک شنبه 20 دی 1388, 14:50 عصر
چند تا سوال با اینکه ۹۹% میدونم مشکل کجاست و جواب چی‌ هست.
۱. چند تا سرور داری (فکر می‌کنم باید ۲ تا مین باشه)
۲. این سرور که ارور میده گک (global Catalog) هست یا نه.
۳. آیا تو زمان خاصی‌ اتفاق می‌افته و دیگه اینکه وقتی‌ که این اتفاق داره می‌افته مثل بککوپ یا چیزی داری که ران میشه،
۴. اکسچنج که نداری
۵. ویندوز چه ورژن هست و چه service pack

kusha313
دوشنبه 21 دی 1388, 07:35 صبح
.با تشکر از شما دوست عزیز که توجه فرمودین

1. چند تا سرور داری (فکر می‌کنم باید ۲ تا مین باشه)
ما 4 تا سرور داریم که روی 2 تا از اونا dns نصبه اول همون سروری که هنگ میکنه و dns اصلی روش نصبه و دومی کپی اون dnsاولی

۲. این سرور که ارور میده گک (global Catalog) هست یا نه.
من نمیدونم گک یعنی چی!!

۳. آیا تو زمان خاصی‌ اتفاق می‌افته و دیگه اینکه وقتی‌ که این اتفاق داره می‌افته مثل بککوپ یا چیزی داری که ران میشه،
ما هر دو ساعت یه بک آپ trn از دیتا بیسمون داریم اما ما توی این دوماهی هم که سرور هنگ نمی کرد این عملیات رو داشتیم و مشکلی پیش نمی اومد

۴. اکسچنج که نداری
راستش من الان چند ماهه که اینجام و خودم replicate یا هرنوع مبادله اطلاعاتی رو تعریف نکردم فکر نمی کنم قبلا تعریف شده باشه اگه بخوام مطمئن بشم از کجا باید ببینم؟

۵. ویندوز چه ورژن هست و چه service pack
2003enterprise service pack2

kusha313
دوشنبه 21 دی 1388, 07:42 صبح
راستی گفتین تقریبا مطمئنین مشکل چیه حالا با این اطلاعات میشه بگید مشکل چیه و من باید چیکار کنم توروخدا نگید که ویندوز سرور رو باید عوض کنم آخه اتوماسیون روش نصبه و هزار مکافات داره آخه خیلیا گفتن مشکلت ویروسه یا چیزایی دیگه ولی جدیدترین آنتی ویروس هم روش نصب کردم که nod32_4 مربوط به سرور که هیچ ویروسی پیدا نکرده قبلا کسپر لایسنس دار بود که اون هم چیزی رو نشون نمیداد

kusha313
سه شنبه 22 دی 1388, 07:42 صبح
دوستان یعنی هیچکس نیست بدونه مشکل من چیه و چه جوری حل میشه :عصبانی++:خواهش می کنم اگه کسی میدونه راهنمایی کنه :گریه::گریه::گریه:

hghyami
سه شنبه 22 دی 1388, 13:05 عصر
چند لحظه صبر کن دارم توضیح رو مینویسم

hghyami
سه شنبه 22 دی 1388, 15:59 عصر
چند تا کار باید بکنیم با هم تا ببینیم چی‌ میشه.

قبل از هر چیز اول مطمئن شو که Backup کامل از System State داری، برای اینکار از رو Run بزن ntbackup بعدش Wizard و از اونجا System State رو انتخاب کن. چون اگر زمانی‌ مشکل پیش بید میشه راحت برگدوند. دوم اینکه مطمئن شو که Support Tools رو داری اگر نه از این LINK (http://www.microsoft.com/downloads/details.aspx?familyid=96A35011-FD83-419D-939B-9A772EA2DF90&displaylang=en) بگیرش

Global Catalog یعنی‌ سرور اصلی‌ که کلّ domain رو control میکنه. (این مشکل رو سرور مادر هست یا اینکه یا سرور دیگه??)

برای اینکه بفهمی کدوم به کدوم هست اینکارو بکن

۱. Administrative Tools - > Active Directory Sites & Services
۲. بعدش Sites + Default... + Servers + "اسم سرور یا سرورها" + Right Click NTDS Settings -> Properties
۳. اگر Global Catalog تیک شده یعنی‌ اون سرور مادر هست.
اگر خواستی‌ از طریق Command Prompt هم میشه

"* repadmin /options"

اگر دیدی زده Current DC Options: IS_GC یعنی‌ این کامپیوتر که داری کار میکنی‌ باهاش GC هست


حالا برای امتحان کردن چند تا کار میشه کرد
۱. dcdiag /test:replications که با اینکار میفهمیم که replication بین domain ‌ها درست هست
۲. dcdiag /test:netlogons که با اینکار میفهمیم permission و این داستانها درست هست
برای درست کردنش هم اینرو اجرا کنیم فقط قبلش باید از registry backup جدا داشته باشیم.

regedit رو باز کن

۱. برو به "hklm\system\currentcontrolset\services\ntfrs\param eters"

۲. مقدار "enable Journal Wrap Automatic Restore" رو از ۰ به ۱ تغییر بعده. اگر که این کی‌ وجود نداره باید یک DWORD دقیقا به همون اسم بسازی و دقت کنی‌ که حروف کوچیک بزرگ مهم هست
۳. از تو command prompt "net stop ntfrs"
۴. از تو command prompt "net start ntfrs"
۵. رو باز کن برو Replication رو ببینEvent Viewer
۱۳۵۵۳ – یعنی‌ DC در حل باز سازی هست
۱۳۵۵۴ – یعنی‌ DC آماده دریافت اطلاعات جدید هست
۱۳۵۱۶ - این هم یعنی‌ هوورا درست شد
۶. از تو command prompt بزن "net share" و ببین sysvol و netlogon هستش ‌یانا. اگر ندیدی اینا رو باید دستی‌ replicate کنی‌ که میگم وگرنه بسته به تنظیمات replication طول میکش
۷. مقدار "enable Journal Wrap Automatic Restore" رو از ۱ به ۰ تغییر بعده.

برای Force Replication یا از همون Active Directory Sites & Services روی همون NTDS Settings و روش right click کن و replicate کن.
یا از command prompt که میشه

"repadmin /syncall"

این لینک‌ها هم بد نیست.در مورد replication اینا توضیح کامل داده و چطوری چک کردن و غیره


۱. Troubleshooting File Replication Service (http://technet.microsoft.com/en-gb/library/bb727056.aspx#EFAA)
۲. Active Directory Operations Guide (http://technet.microsoft.com/en-gb/library/bb727062.aspx#E0FE0AA)

یک چیز دیگه هم که هست ولی‌ بعید میدونم و امیدوارم نشده باشه این هست که یک بر "chkdsk" رو اجرا کن ببین ارور میده یعنی‌. البته روی partition فعال نمیشه اینکارو کرد و باید حتما غیر فعال بشه که معمول خودش میگه که می‌خوای دفع دیگه که boot شد اینکارو انجام بدم

hghyami
پنج شنبه 24 دی 1388, 12:12 عصر
چی‌ شد دوست آزی چک کردیش یا نه؟