اگر شما هم به صنعت صدا علاقه داشته باشید و موضوعاتی که پیرامون آن گفته میشود را دنبال کنید، متوجه مقالهها و موضوعات زیادی پیرامون کابلهای گران قیمت و یا موسیقی High Resolution یا hi-res میشوید. اما این نوع موسیقی چیست؟ موسیقی hi-res در واقع به نوعی فایل موسیقی گفته میشود که سمپل ریت و عمق بیت آن بیشتر از ۴۴.۱ کیلوهرتز و ۱۶ بیت باشد.
اگر میخواهید بیشتر در مورد سمپل ریت، عمق بیت و بیت ریت بدانید، تا انتهای این مقاله، سازکالا را همراهی کنید تا به تمامی پرسشهای شما در این زمینه پاسخ دهیم.
یک صدا چطور به شکل دیجیتالی ضبط می شود؟
هنگامی که یک صدا تولید میشود، امواج صوتی ای از منبع انتشار، منتشر میشود که این امواج در هوا پخش میشود. اگر دیافراگم یک دستگاه ضبط صوت، برای مثال دیافراگم میکروفون نزدیک این امواج قرار گیرد، این امواج میتوانند دیافراگم را به لرزه درآورند. تفاوت دیافراگم میکروفون ها را میدانید؟
به لطف وجود مبدلها در همه میکروفونها، این ارتعاش ایجاد شده در دیافراگم به یک سیگنال الکتریکی تبدیل میشود. در صورت تداوم این امواج در هوا و برخورد آن با دیافراگم میکروفون، سیگنال الکتریکی به طور مداوم توسط میکروفون تولید میشود.
اما سیگنالی که توسط دیافراگم تولید میشود به طور عادی از قدرت زیادی برخوردار نیست و برای افزایش قدرت این سیگنال، از پری آمپلی فایرها استفاده میشود. محیطی که امواج صوتی در آن وجود دارند را، محیط یا فضای آنالوگ مینامند.
نگهداری سیگنال آنالوگ
در طول تاریخ، از متریال مختلفی برای ضبط و نگهداری سیگنالهای آنالوگ استفاده شده است. از جمله میتوانیم به واکس، نواز کاست و یا صفحه گرامافونها اشاره کنیم. پس از مدتی اما، صدا به شکل دیجیتالی به بازار عرضه و از استقبال خوبی نیز برخوردار شد.
نگهداری سیستم دیجیتال
اما روش کاری این سیستمهای دیجیتالی به چه گونه است؟ سیستمهای دیجیتالی که به شکل صفر و یک کار میکنند، سیگنالهای آنالوگ (امواج صوتی موجود در هوا) را به روش سمپل کردن ضبط میکنند.
با گرفتن مقادیر کافی سمپل از یک سیگنال آنالوگ و ذخیره آنها در حافظه خود، رکوردرهای دیجیتالی قادر هستند تا این سیگنالها را دریافت و سپس آنها را باز تولید کنند.
یک ضبط دیجیتالی در دنیای کنونی شامل ۴۴۱۰۰ سمپل در ثانیه میباشد. اما با این وجود، غیر طبیعی نیست که گاهی فایلهایی را مشاهده کنیم که به فرمت ۹۶۰۰۰ سمپل ضبط شده اند.
روشهای مختلفی برای سمپل کردن یک سیگنال آنالوگ وجود دارد اما مشهورترین و پرکاربردترین آن، روش Pulse Code Modulation یا PCM است. برای اطلاع از تحول موسیقی آنالوگ به سیستم دیجیتال میتوانید مقاله تحول ظبط استودیویی در دهه ۹۰ را مطالعه فرمایید.
روش PCM چیست؟
روش PCM در واقع روشی استاندارد در زمینه سمپل کردن سیگنالهای آنالوگ به فرمت دیجیتالی میباشد. در این روش، یک موج صوتی به طور یک شکل و در اندازههای یکسان سمپل گیری میشود. جالب است بدانید که این روش، به طور رایگان در اختیار تمامی افراد قرار داده شده و همه میتوانند به این روش شروع به سمپل کردن صداهای مختلف کنند!
اما نکته ای که وجود دارد، این است که شما به احتمال خیلی زیاد هیچگاه یک فایل صوتی را با فرمت PCM نخواهید دید. دلیل آن نیز حجم بسیار بالا و عدم پشتیبانی برای پخش این نوع فرمت صوتی است.
اندازه فایلهای PCM
فایلهای PCM در واقع فایلهای فشرده نشده هستند بنابراین اندازه این فایلها بسیار بزرگ خواهد بود. اما با این حال، روشهای مختلفی وجود دارد که میتوانید این فایلها را فشرده کنید.
از میان این روشها می توان به Dolby و DTS اشاره کرد که قابلیت این را دارند تا اندازه فایلها PCM را تا اندازه ۹۰% کاهش دهند.
متاسفانه این روشها علیرغم این که باعث کاهش حجم این فایلها میشود اما روش دیکد کردن آنها بهترین روش ممکن نیست و فایل به دست آمده، از نظر کیفیت بسیار ضعیفتر از فایل قبلی خود خواهد بود.
این جاست که روشهایی همانند Dolby Digital TrueHD و DTS-HD به کار میآیند. این روش دیکد کردن، این امکان را به شما میدهد تا نه تنها از نظر حجم فایل، فایلی بسیار کم حجم در اختیار داشته باشید، بلکه از نظر کیفیتی نیز تفاوتی با فایلهای PCM ندارند.
پشتیبانی و قابلیت پخش (پلیبک)
متاسفانه بسیاری از سیستم عاملهای محبوب نمیتوانند فایلهای PCM را پخش کنند. شرکت مایکروسافت از فرمت Waveform Audio Format یا WAV استفاده میکند در حالی که شرکت اپل از فرمت Audio Interchangeable File Format یا AIFF بهره میبرد.
این نامها در واقع نامهای دیگری برای فایلهایی هستند که به روش PCM ضبط شده اند، تفاوت آنها در این است که میتوانید نام برای آنها انتخاب کنید و یا اطلاعاتی را در مورد آنها تغییر دهید.
کیفیت PCM
کیفیت یا فیدلیتی فایلهای PCM بر اساس دو معیار شناسایی میشود.
- سمپل ریت
- عمق بیت
این دو معیار در واقع به ما نشان میدهند که یک فایل دیجیتالی تا چه حد از نظر کیفیت نزدیک به سیگنال آنالوگ اصلی بوده است.
سمپل ریت چیست؟
فیلمهای انیمیشنی دهههای قبل را به یاد آورید.
این فیلمها در واقع عکسهای مختلفی بودند که پشت سر هم نمایش داده میشدند تا نوعی حرکت را به نمایش درآورند. سرعت تعویض این عکسها تعیین میکرد که این حرکت تا چه حد از نظر بیننده روان است. هر چه این سرعت بیشتر میبود، بیننده تجربه بهتری از دیدن این انیمیشن داشت.
این در حالی است که در دنیای کنونی، تغییر این عکسها در کمتر از صدم ثانیه اتفاق میافتد.
در دنیای صدا، سمپل ریت در واقع حکم فریم ریت در دنیای تصویر و فیلم را دارد. هر چه داده صدایی (سمپل) بیشتری ضبط شده باشد، کیفیت صدا به سیگنال آنالوگ اصلی نزدیکتر خواهد بود.
هنگامی که شما به یک سی دی که در آن آهنگ ریخته شده گوش میدهید، سمپل ریت برابر با ۴۴۱۰۰ یا ۴۴.۱ هزار هرتز خواهد بود. شاید با خود بگویید چرا باید کیفیت صدا تا این اندازه بالا باشد در حالی که گوش انسان نهایتا تا ۲۰ هزار هرتز را میشوند؟ دلیل این موضوع قضیه ای است که با نام قضیه شانون-نایکوئیست مشهور است.
قضیه نایکوئیست
قضیه نایکوئیست که به آن فرکانس نایکوئیست نیز گفته میشود، ادعا میکند که برای آن که کمترین اطلاعات ممکن هنگام سمپل گیری دیجیتالی از بین برود و سیگنال دیجیتالی ای بسیار دقیق در اختیار داشته باشیم، باید سمپل گیری را با نرخی دو برابر بالاترین فرکانس مورد نظر انجام دهیم.
از دیگر نرخهای سمپل گیری یا سمپل ریت میتوانیم به ۸۰۰۰ هرتز در تلفنها و یا ۹۶۰۰۰ یا حتی ۱۹۲۰۰۰ هرتز برای صداهای Blu-Ray اشاره کنیم. از سمپل ریت ۳۸۴۰۰۰ نیز در شرایط خاصی استفاده میشود که میتوان به ضبط صدای حیوانات برای ساخت صداهای Ultrasonic اشاره کرد.
عمق بیت چیست؟
تمامی کامپیوترها اطلاعات خود را با استفاده از ۰ و ۱ ذخیره میکنند. این اعداد که به آن باینری گفته میشود، با نام بیت نیز شناخته میشود. هر چه تعداد بیتهای ما بیشتر باشد، نیاز به فضای بیشتری برای ذخیره این اطلاعات خواهیم داشت.
هنگامی که یک سیگنال سمپل میشود، باید این اطلاعات سمپل شده به شکل بیتها ذخیره شود. اینجاست که عمق بیت یا عمق بیت (به انگلیسی Bit Depth) به کار ما میآید. در واقع عمق بیت به ما میگوید که تا چه حد امکان ذخیره سمپل را خواهیم داشت. یک فایل با عمق بیت ۲۴ بیت، جزئیات بیشتری را نسبت به یک فایل با عمق ۱۶ بیت در اختیار ما میگذارد.
برای آن که دقیقتر این موضوع را بررسی کنیم، باید ببینیم هر کدام از این فایلها چه مقدار اعداد باینری را در خود ذخیره میکنند.
- در یک فایل ۱۶ بیتی، ما میتوانیم ۶۵,۵۳۶ لول اطلاعاتی را ذخیره کنیم.
- در یک فایل ۲۴ بیتی، ما میتوانیم ۱۶,۷۷۷,۲۱۶ لول اطلاعاتی را ذخیره کنیم.
همانطور که مشاهده کردید، تفاوت میان دو عمق بیت بسیار بالا میباشد.
بازه دینامیکی (داینامیک رنج)
یکی دیگر از نکاتی که عمق بیت بر روی آن تاثیر میگذارد، داینامیک رنج یا بازه دینامیکی سیگنال میباشد. یک فایل صوتی ۱۶ بیتی، به ما حداکثر بازه دینامیکی ۹۶ دسی بل را میدهد در حالی که یک فایل ۲۴ بیتی، بازه دینامیکی ۱۴۴ دسی بل را در اختیار ما میگذارد.
عموما عمق بیت سیگنال در سی دیها برابر با ۱۶ بیت است زیرا به طور کلی ما میخواهیم صداهایی را در اختیار داشته باشیم که تا حدی که آنها را بشنویم بلند باشند و نیازی به صداهایی نداریم که بلندی آنها نه تنها به گوش ما، بلکه به تجهیزات پخش موسیقی ما آسیب برساند.
عمق بیت ۱۶ بیت و سمپل ریت ۴۴.۱ هزار هرتز کاملا از نظر شنیدن تمامی فرکانسها و همچنین از نظر بلندی صدا برای عموم مردم کافی میباشد. به همین دلیل است که این دو پارامتر، در بسیاری از فایلهای MP3 و یا CD مورد استفاده قرار میگیرند.
آیا باید همیشه برای ضبط از سمپل ریت ۱۹۲ هزار هرتز و عمق بیت ۲۴ بیت استفاده کنیم؟
با این که هیچ محدودیتی برای ضبط از لحاظ سمپل ریت و عمق بیت وجود ندارد، اما برای تولید فایلهای hi-res، سمپل ریت 192kHz و عمق بیت ۲۴ بیت، بهترین حالت ممکن است. اما به طور کلی، ما به عنوان رفرنس از این نرخ سمپل گیری و عمق بیت برای ضبط با حداکثر کیفیت استفاده میکنیم. اما شاید با خود بگویید چه موقعی باید این تصمیم را بگیریم؟
ما میدانیم که هر چه قدر سمپل ریت و عمق بیت بیشتر باشد، صدای ما به صدای آنالوگ اصلی نزدیکتر و شبیهتر خواهد بود. اما این تمام ماجرا نیست زیرا با بالا بردن این مقادیر ما از هدروم بیشتری نیز میتوانیم استفاده کنیم.
هدروم بیشتر
به اختلاف بازه دینامیکی سیگنال و حداکثر بازه دینامیکی موجود در عمق بیت، هدروم گفته میشود. به عنوان مثال، به کامیونی فکر کنید که ارتفاع آن ۳ متر است و میخواهیم آن را درون تونلی ببریم که ۵ متر ارتفاع دارد. در این جا، ما ۲ متر هدروم در اختیار داریم که میتوانیم از آن استفاده کنیم.
سمپل کردن در عمق بیت ۱۶ بیتی، به ما ۹۶ دسی بل بازه دینامیکی میدهد که میتوانیم در این رنج با سیگنال مورد نظر کار کنیم. در حالی که عمق بیت ۲۴ بیتی برای ما بازه دینامیکی ۱۴۴ دسی بل به ارمغان میآورد. جالب است بدانید که در حالت ایده آل، اکثر تجهیزات ضبط صوت تنها میتوانند تا ۱۲۵ دسی بل بازه دینامیکی تولید کنند!
با استفاده از این هدروم اضافی، مهندسین صدا میتوانند احتمال به وجود آمدن دیستورشن و نویز اضافه که به آن کلیپینگ نیز گفته میشود را، کمتر و یا به طور کامل از سیگنال حذف کنند.
کلیپینگ یا کلیپ دادن هنگامی اتفاقی میافتد که سیگنال الکتریکی ورودی بیشتر از حداکثر بازه دینامیکی از نظر عددی باشد. این اتفاق بیشتر هنگامی رخ میدهد که از عمق بیت کمتر از حد نیاز استفاده کرده باشیم.
به دلیل وجود هدروم بیشتر در عمق بیت ۲۴ بیتی، بسیاری از مهندسان حرفهای از این عمق بیت برای ضبط استفاده میکنند تا در مرحله میکس و مسترینگ، بتوانند پردازشهای گوناگون و افکتهای مختلف را، بدون نگرانی از بابت کلیپینگ بر روی صداها انجام دهند.
فایلهای بزرگ تر
با این که با بالا رفتن مقادیر سمپل ریت و عمق بیت ما هدروم بیشتری در اختیار داریم، این کیفیت بالاتر در فایلهایی با اندازه بسیار بزرگتر ذخیره میشود.
روش محاسبه اندازه فایل
برای آن که متوجه تفاوت در اندازه فایلها شوید، به یک فایل موسیقی ۵ دقیقه ای فکر کنید که فشرده سازی بر روی آن صورت نگرفته است.
- با استفاده از فرمول فرکانس سمپل شده x عمق بیت x تعداد چنلها بیت ریت را محاسبه میکنیم. (برای یک آهنگ، تعداد چنلها به دلیل استریو بودن فایل، ۲ میباشد.)
- ۴۴.1kHz/16-bit: 44100x16x2 = 1,411,200 (1.4Mbps) بیت در ثانیه
- 192kHz/24-bit: 192000x24x2 = 9,216,000 (9.2 Mbps) بیت در ثانیه
- مقدار بیت ریت به دست آمده را در مدت زمان فایل به ثانیه ضرب میکنیم. (عدد مگابیت (Mb) را بر ۸ تقسیم میکنیم تا به مگابایت (MB) برسیم)
- ۴۴.1kHz/16-bit: 1.4Mbpsx300s = 420Mb (52.5MB)
- 192kHz/24-bit: 9.2Mbpsx300s = 2760Mb (345MB)
واضح است که صدایی که با استفاده از مقادیر 192kHz/24-bit ضبط شده است، بیش از ۶.۵ برابر فایلی که با مقادیر ۴۴.1kHz/16-bit ضبط شده فضا میگیرد!!
پس چه هنگام نیاز است تا با فرمت 192kHz/24-bit ضبط کنیم؟
این موضوع کاملا بستگی به شما دارد. اگر میخواهید هدروم حداکثری داشته باشید و فضای ذخیره کردن فایلها برای شما دغدغه نیست، استفاده از فرمت 192kHz/24-bit بهترین گزینه است. اما اگر میخواهید فایل ضبط شده خود را برای افراد عادی ضبط و میکس کنید، استفاده از فرمت 192kHz/24-bit تنها باعث اضافه شدن هزینه اینترنت آنها خواهد شد!
آیا استفاده از فرمت ۱۹۲kHz/24-bit باعث بهتر شدن تجربه اهنگ گوش دادن ما میشود؟
پاسخ این سوال به طور خلاصه منفی است
کریس مونتگومری، یک مهندس صدای حرفهای، توضیح دقیقی درباره این موضوع داده که چرا گوش دادن به فایلهایی با فرمت 192kHz/24-bit تفاوت چندانی را برای ما ایجاد نخواهد کرد.
او با ترکیب روش پردازش سیگنال و همچنین اطلاعاتی که از انسان در زمینه گوش دادن به صدا داشت، به این نتیجه رسید که استفاده از فرمت 192kHz/24-bit کاری عملا بیهوده است!
از دید ما، نگرش کریس تا حد بسیار زیادی درست است. هنگامی که کیفیت از حدی فراتر برود، تشخیص دادن این کیفیت بیشتر کاری دشوار خواهد بود تا جایی که به طور کل متوجه آن نمیشویم.
بیت ریت چیست؟
به تعداد بیتهایی که در واحد زمان پردازش میشود، بیت ریت گفته میشود. این واحد زمانی، ممکن است ثانیه، دقیقه و یا حتی ساعت باشد.
در واقع تعریف بیت ریت شباهت بسیاری به سمپل ریت دارد، با این تفاوت که به جای شمردن سمپلها، این جا به شمردن بیت میپردازیم.
بیت ریت بیشتر برای سرویسهای استریمینگ حائز اهمیت است و در ضبط صدا، تاثیری ندارد.
جالب است بدانید که بیت ریت تنها به دنیای صدا خلاصه نمیشود و در مولتیمدیا و نتورکینگ نیز به کرات آن را میشنویم. با این حال، در دنیای موسیقی، بیت ریت بیشتر عموما به معنای کیفیت بالاتر است. دلیل آن این است که هر بیت در یک فایل صوتی، حاوی دادههایی است که میتوانیم از آن برای باز تولید صدا استفاده کنیم.
به طور سادهتر، هر چه تعداد بیت بیشتری را بتوانید در واحد زمانی مشخص جا دهید، صدایی که دریافت میکنید، صدایی نزدیکتر به صدای دنیای آنالوگ خواهد بود.
متاسفانه بیت ریت بالاتر برابر است با فایلی حجیمتر. که برای صرفه جویی در فضا و همچنین پهنای باند، کاری عقلانی ای به شمار نمیرود. فضا و پهنای باندی که همواره جزو دغدغههای اصلی سرویسهای استریمینگ از جمله اسپاتیفای یا اپل میوزیک بوده است.
سرویسهای استریمینگ موزیک
همانطور که پیشتر محاسبه کردیم، برای استریم کردن یک فایل فشرده نشده ۵ دقیقه ای با فرمت ۴۴.1kHz/16-bit، به بیت ریت ۱.4Mbps نیاز داریم که یک پهنای باند عظیم محسوب میشود!
روش دور زدن سرویسهای استریمینگ موزیک همانند اسپاتیفای یا اپل میوزیک، به این شکل است که این فایلها را فشرده سازی میکنند. البته طبیعیست که این فشرده سازی بدون اثرات منفی نخواهد بود. برای مثال، اسپاتیفای بیت ریت آهنگها را برای کاربران دسکتاپ خود برابر 160kbps و برای کاربران موبایل 96kbps قرار داده است. این در حالی است که کاربران سرویس Premium قابلیت گوش دادن به آهنگها با بیت ریت 320kbps را در دسکتاپ دارند. اما کاربران اپل میوزیک تنها میتوانند از بیت ریت 256kbps استفاده کنند.
سرویسهای دیگری نیز وجود دارد که برای افرادی ساخته شده که به دنبال گوش دادن به آهنگهای مورد علاقه خود با کیفیت بالا هستند. شما میتوانید از سرویسهایی نظیر TIDAL یا Qobuz Sublime+ استفاده کنید. این دو سرویس همچنین از گزینه Hi-Fi نیز بهره میبرند.
سرویس تیدال، فایلها را به فرمت ۴۴.1kHz/16-bit FLAC در اختیار شما قرار میدهد و بیت ریت آنها برابر با 1411kbps میباشد.
آیا بیت ریت بیشتر به معنای تجربه گوش دادن به موسیقی بهتر است؟
کدک MP3 به طور کلی برای کمپرس کردن فایلها با فرمت CD معرفی شد که این قابلیت را داشت تا بدون کم شدن کیفیت صدا، فایل مورد نظر حجم کمتری بگیرد. اولین انکودرهای MP3 با بیت ریتهای 128kbps و 192kbps به بازار عرضه شدند و پس از آن، برای رقابت با دیگر کدکها، بیت ریت 320kbps نیز به بازار عرضه شد. اما در سرویسهای استریمینگ از کدک Ogg Vorbis برای اسپاتیفای و AAC برای اپل میوزیک استفاده میشود.
با توجه به دیدگاه کریس مونتگومری، ما میدانیم که بیت ریتهای بیشتر از 192kbps به گونه ای نیستند که گوش انسان قادر به تشخیص آن باشد.
به عبارت دیگر، این دیدگاه به ما میگوید که آهنگی با بیت ریت 192kbps، تا هنگامی که به درستی به Ogg، MP3، AAC یا FLAC انکود شود، کیفیتی کاملا معادل با امواج صوتی در دنیای آنالوگ را دارد.
اما این به این معنا نیست که بیت ریتهای بالاتر بلا استفاده خواهند بود. اگر شما یک سیستم Hi-Fi گران قیمت داشته باشید شاید بتوانید تفاوت بسیار جزئی میان بیت ریتهای مختلف را متوجه شوید، اما اگر تنها با یک هدفون عادی به موسیقی مورد علاقه خود گوش میدهید، فرقی میان آهنگهایی که از بیت ریت 192kbps بیشتر هستند را متوجه نمیشوید.
جمع بندی سازکالا
به طور خلاصه، سمپل ریت تعداد سمپلهایی است که در واحد زمان ضبط میشود و عمق بیت به معنای آن است که این سمپلها با چه دقتی انکود میشوند. در نهایت نیز، بیت ریت به تعداد بیت ضبط شده در واحد زمان گفته میشود.
امیدواریم با مطالعه این مقاله بسیاری از سوالاتی که پیرامون این سه موضوع داشته اید را برطرف کرده باشیم. این مطالب به شما کمک میکند تا درک درستتری از اعداد و ارقام هنگام گوش دادن به موسیقی داشته باشید.
بسیار مفید بود و به راستی پاسخ بسیاری از پرسشهام که در این سالها (از آفرینش mp3 به این سو) پیش اومده بودن در این نوشتار بود.
جز این پرسش که آیا افزایش بیت ریت و سمپل ریت فایلهای mp3 موجود ، باعث بالا رفتن کیفیت میشه یا تنها افزایش حجم فایل است بی آنکه تاثیر چندانی در کیفیت داشته باشه؟
سلام دوست عزیز
فقط باعث افزایش حجم میشه
بسیار جامع و عالی
🌸🙏