اصولا خود سیستم عامل فایل ها رو دسته ای می خونه . بع عبارت دیگه هارد دیسک یک بایت رو نمی خونه دسته ای از بایت که کلاستر نام داره را می خونه . برای همین تاثیر چشمگیری روی سرعت نمی زاره
اینکه کاملا مشخصه که سیستم عامل کلاستری می خونه اما موقع برنامه نویسی اگه یک بایت هم بخونی مجبوره یک کلاستر رو بخونه در نتیجه خواندن بایت به بایت باعث می شه به ازای هر بایت یک کلاستر بخونه که در نتیجه زمان بیشتری می بره.

مثال شما توی C#‎ مثال خوبی نیست چون کد شما توی IL اجرا می شه.
مقایسه من در دو روش داره از IL استفاده می کنه پس هیچ ربطی به IL نخواهد داشت.(بستر مقایسه یکسان)

در ضمن این که گفتم باید با C بنویسی دلیلش اینه که کد باینری تولید شده توسط کامپایلر فقط اگر Native باشه بیشترین سرعت را داره
مطمئنن حرف شما درسته. البته من منظورم نوع کامپایلر مثلا استفاده از کامپایلر intel به جای کامپایلر microsoft

موفق باشید.