همه‌چیز درباره I2S در ESP32: مفاهیم پایه و کاربرد با ماژول‌های INMP441 و PCM5102

0 995 زمان تقریبی مطالعه 4 دقیقه

مروری جامع بر مبانی، اجزا و کاربرد I2S در ESP32 همراه با ماژول‌های INMP441 و PCM5102

چکیده:
پروتکل I2S یکی از مهم‌ترین استانداردهای انتقال صوت دیجیتال است که به کمک آن می‌توانید کیفیت و سرعت ارتباط صدا در سیستم‌های امبدد را به‌طور چشمگیری ارتقاء دهید. در این راهنمای جامع به موارد زیر می‌پردازیم:

تاریخچه و فلسفه پیدایش I2S
ساختار سیگنال‌ها و جزییات فنی
بررسی کامل ماژول‌های صوتی INMP441 و PCM5102
اتصالات سخت‌افزاری و نکات طراحی
پیاده‌سازی نرم‌افزار: ساخت سیستم کنفرانس صوتی بلادرنگ
نکات پیشرفته برای بهینه‌سازی و عیب‌یابی
پروژه‌های پیشنهادی

۱. تاریخچه و فلسفه پیدایش I2S

در اواخر دهه ۱۹۸۰، شرکت Philips با هدف حل مشکلات تبدیل مکرر دیجیتال-آنالوگ و آنالوگ-دیجیتال در تجهیزات صوتی، پروتکل I2S را معرفی کرد. تا پیش از آن، ارتباط بین مبدل‌های صوتی و پردازشگرها از طریق رابط‌های کلی مانند SPI یا I2C انجام می‌شد که:

توقف و تاخیر در انتقال (Latency) ایجاد می‌کرد
نیاز به خطوط کمکی زیاد برای همگم‌سازی داشت
کیفیت صدا در نرخ نمونه‌برداری بالا دچار خطا و جیتتر می‌شد

I2S با ارائه سه خط اختصاصی (کلاک بیت، کلاک کانال و داده صوتی) این مشکلات را رفع کرد و امکان انتقال پیوسته، بدون وقفه و دقیق را در کاربردهای صوتی حرفه‌ای فراهم ساخت.

۲. ساختار سیگنال‌ها و جزییات فنی

۲.۱. اجزای اصلی I2S

I2S بر پایه سه سیگنال اصلی کار می‌کند:

BCLK (Bit Clock): کلاکی است که برای هر بیت داده تیک می‌خورد. فرکانس آن برابر است با:به عنوان مثال، برای صدای استریو 16 بیتی با نرخ 44.1kHz: 44,100 × 16 × 2 = 1.4112 MHz.
WS/LRCK (Word Select / Left-Right Clock): برای تعیین اینکه بیت‌های ارسالی مربوط به کانال چپ یا راست هستند استفاده می‌شود. فرکانس آن برابر نرخ نمونه‌برداری است (مثلاً 44.1kHz).
DATA (Serial Data): خطی که داده‌های صوت دیجیتال (نمونه‌ها) به صورت سریال ارسال می‌شوند. معمولاً با MSB (بیت ارزشمندتر) شروع می‌شود.

۲.۲. فرمت‌های داده و حالت‌های انتقال

I2S می‌تواند از حالت‌های مختلفی پشتیبانی کند:

Philips Standard: جابجایی داده پس از لبه دوم BCLK.
MSB-Justified: داده دقیقاً همزمان با لبه WS ارسال می‌شود.
LSB-Justified: کمترین بیت ارزشمند زودتر ارسال می‌شود.
PCM: حالت‌های تک‌بیتی با پالس Sync متفاوت.

۲.۳. ویژگی‌های کلیدی I2S

همگام‌سازی دقیق: با استفاده از کلاک‌های اختصاصی، از مشکلات جیتتر و اختلاف فاز جلوگیری می‌شود.
تاخیر کم: ایده‌آل برای کاربردهای بلادرنگ.
مقیاس‌پذیری: از یک کانال تا چندین کانال (Multi-channel audio) قابل توسعه است.
سازگاری گسترده: توسط اکثر تولیدکنندگان ADC، DAC، و میکروکنترلرها پشتیبانی می‌شود.

۳. معرفی ماژول‌های صوتی: INMP441 و PCM5102

برای اجرای I2S در پروژه‌های عملی، اغلب از ماژول‌های آماده استفاده می‌شود. در ادامه دو ماژول محبوب را بررسی می‌کنیم.

۳.۱. ماژول میکروفون MEMS INMP441

INMP441 یک ماژول میکروفون دیجیتال استریو است که خروجی آن مستقیماً از طریق I2S ارائه می‌شود.

ویژگی	شرح
سنسور	MEMS Omnidirectional
ADC	24 بیت
نرخ نمونه‌برداری	32–48 kHz
نسبت سیگنال به نویز	≈ 61 dBA
مصرف برق	حدود 1 mA
ولتاژ کاری	1.5–3.6 V

نحوه کار داخلی:

فشار مکانیکی حاصل از صدا به سیگنال الکتریکی تبدیل می‌شود.
ADC داخلی آن را به داده دیجیتال 24 بیتی تبدیل می‌کند.
داده‌ها در قالب نمونه‌های 32 بیتی (با اضافه‌شدن بیت‌های صفر) از طریق خطوط I2S ارسال می‌شوند.

ماژول میکروفون MEMS INMP441 با رابط I2S

خرید کالا

موارد استفاده رایج:

ضبط صدا با کیفیت بالا
تشخیص گفتار و پردازش سیگنال صوتی
برنامه‌های IoT صوتی

۳.۲. ماژول DAC استریو PCM5102

PCM5102 یک مبدل دیجیتال به آنالوگ پیشرفته است که برای پخش صدای Hi‑Fi طراحی شده.

ویژگی	شرح
معماری DAC	2×32‑bit Delta‑Sigma
نسبت سیگنال به نویز	112 dB
اعوجاج کلی (THD+N)	0.0025%
نرخ نمونه‌برداری	8–384 kHz
ولتاژ کاری	4.5–5.5 V
خروجی آنالوگ	2.1 Vrms (Line Level)

ویژگی‌های متمایز:

فیلتر دیجیتال oversampling برای کاهش نویز
خروجی استریو با امپدانس پایین
نیاز به حداقل قطعات جانبی

ماژول مبدل دیجیتال به آنالوگ استریو PCM5102 با ارتباط I2S

خرید کالا

موارد استفاده رایج:

پخش موسیقی kaliteli
سیستم‌های صوتی حرفه‌ای
سرویس‌های پخش صوت در دستگاه‌های IoT

۴. نحوه اتصال ماژول ها به ESP32

۴.۱. نمودار اتصالات

برای پیاده‌سازی سیستم کنفرانس صوتی، اتصالات زیر را برقرار کنید:

INMP441               ESP32 (I2S0 Rx)
-------------------------------------
VDD (3.3V)      →      3.3V
GND             →      GND
LRCL/WS         →      GPIO25
BCLK            →      GPIO26
DOUT            →      GPIO22
SEL             →      GND

PCM5102              ESP32 (I2S1 Tx)
-------------------------------------
VIN (5V)        →      5V
GND             →      GND
LRCK/WS         ←      GPIO12
BCLK/SCK        ←      GPIO14
DIN             ←      GPIO13
FMT             →      GND
XMT (Mute)      →      GND
LOUT/ROUT       →      Speaker/Headset

INMP441 ESP32 (I2S0 Rx)

-------------------------------------

VDD (3.3V) → 3.3V

GND → GND

LRCL/WS → GPIO25

BCLK → GPIO26

DOUT → GPIO22

SEL → GND

PCM5102 ESP32 (I2S1 Tx)

-------------------------------------

VIN (5V) → 5V

GND → GND

LRCK/WS ← GPIO12

BCLK/SCK ← GPIO14

DIN ← GPIO13

FMT → GND

XMT (Mute) → GND

LOUT/ROUT → Speaker/Headset

۴.۲. نحوه ارتباط و کارکرد ماژول ها با ESP32

داده صوتی از INMP441 وارد بخش I2S0 در ESP32 می‌شود.
ESP32 با DMA، داده را به بافرهای داخلی منتقل می‌کند.
داده از بافرها مستقیماً به I2S1 هدایت شده و به PCM5102 ارسال می‌شود.
PCM5102 تبدیل دیجیتال-آنالوگ انجام می‌دهد و خروجی به بلندگو/هدست می‌رود.

برد توسعه ESP32 دارای Wifi و بلوتوث 38 پایه

خرید کالا

۵. پیاده‌سازی نرم‌افزار: سیستم کنفرانس صوتی

۵.۱. آماده‌سازی محیط

Arduino IDE را باز کرده و از Tools → Board → ESP32 Dev Module استفاده کنید.
مطمئن شوید که پکیج ESP32 نصب است (از Boards Manager).
کتابخانه I2S به صورت پیش‌فرض در این پکیج موجود است.

۵.۲. کد نمونه Arduino-ESP32 با افکت اکو و کنترل میزان آن با ولوم

#include &lt;I2S.h&gt;

// پین‌های I2S برای ورودی و خروجی
#define IN_BCK    26
#define IN_WS     25
#define IN_DATA   22
#define OUT_BCK   14
#define OUT_WS    12
#define OUT_DATA  13

// پین ولوم (پتانسیومتر)
#define VOL_PIN   34

const int sampleRate = 48000;
const int bitsPerSample = 32;
const int echoDelay = 24000; // تاخیر به تعداد نمونه (نیم ثانیه برای 48kHz)
const float maxEchoMix = 0.8; // حداکثر نسبت اکو

// بافر حلقوی برای افکت اکو
static int32_t echoBuffer[echoDelay];
static int echoIndex = 0;

void setup() {
  Serial.begin(115200);
  while (!Serial);

  // راه‌اندازی آنالوگ برای ولوم
  analogReadResolution(12);

  // پاک کردن بافر اکو
  memset(echoBuffer, 0, sizeof(echoBuffer));

  // راه‌اندازی I2S Rx
  I2S.begin(I2S_PHILIPS_MODE, sampleRate, bitsPerSample,
            I2S_BITS_PER_SAMPLE_32BIT, I2S_COMM_FORMAT_STAND_I2S,
            I2S_CHANNEL_FMT_RIGHT_LEFT,
            IN_BCK, IN_WS, IN_DATA);

  // راه‌اندازی I2S Tx
  I2S.setPins(OUT_BCK, OUT_WS, OUT_DATA);
  I2S.begin(I2S_PHILIPS_MODE, sampleRate, bitsPerSample,
            I2S_BITS_PER_SAMPLE_32BIT, I2S_COMM_FORMAT_STAND_I2S,
            I2S_CHANNEL_FMT_RIGHT_LEFT);

  Serial.println("Conference system with echo ready!");
}

void loop() {
  static int32_t buffer[1024];
  int bytesRead = I2S.read((char*)buffer, sizeof(buffer));
  if (bytesRead &lt;= 0) return;

  // خواندن مقدار ولوم از پتانسیومتر
  int volRaw = analogRead(VOL_PIN);
  float echoMix = (volRaw / 4095.0) * maxEchoMix;

  // اعمال افکت اکو
  for (int i = 0; i &lt; bytesRead/4; i++) {
    int32_t inSample = buffer[i];
    int32_t delayed = echoBuffer[echoIndex];
    // مخلوط کردن و نوشتن به بافر
    int32_t outSample = inSample + delayed * echoMix;
    buffer[i] = outSample;
    // به‌روزرسانی بافر حلقوی
    echoBuffer[echoIndex] = inSample;
    echoIndex = (echoIndex + 1) % echoDelay;
  }

  // ارسال داده به DAC
  I2S.write((char*)buffer, bytesRead);
}

#include <I2S.h>

// پین‌های I2S برای ورودی و خروجی

#define IN_BCK 26

#define IN_WS 25

#define IN_DATA 22

#define OUT_BCK 14

#define OUT_WS 12

#define OUT_DATA 13

// پین ولوم (پتانسیومتر)

#define VOL_PIN 34

const int sampleRate = 48000;

const int bitsPerSample = 32;

const int echoDelay = 24000; // تاخیر به تعداد نمونه (نیم ثانیه برای 48kHz)

const float maxEchoMix = 0.8; // حداکثر نسبت اکو

// بافر حلقوی برای افکت اکو

static int32_t echoBuffer[echoDelay];

static int echoIndex = 0;

void setup() {

Serial.begin(115200);

while (!Serial);

// راه‌اندازی آنالوگ برای ولوم

analogReadResolution(12);

// پاک کردن بافر اکو

memset(echoBuffer, 0, sizeof(echoBuffer));

// راه‌اندازی I2S Rx

I2S.begin(I2S_PHILIPS_MODE, sampleRate, bitsPerSample,

I2S_BITS_PER_SAMPLE_32BIT, I2S_COMM_FORMAT_STAND_I2S,

I2S_CHANNEL_FMT_RIGHT_LEFT,

IN_BCK, IN_WS, IN_DATA);

// راه‌اندازی I2S Tx

I2S.setPins(OUT_BCK, OUT_WS, OUT_DATA);

I2S.begin(I2S_PHILIPS_MODE, sampleRate, bitsPerSample,

I2S_BITS_PER_SAMPLE_32BIT, I2S_COMM_FORMAT_STAND_I2S,

I2S_CHANNEL_FMT_RIGHT_LEFT);

Serial.println("Conference system with echo ready!");

}

void loop() {

static int32_t buffer[1024];

int bytesRead = I2S.read((char*)buffer, sizeof(buffer));

if (bytesRead <= 0) return;

// خواندن مقدار ولوم از پتانسیومتر

int volRaw = analogRead(VOL_PIN);

float echoMix = (volRaw / 4095.0) * maxEchoMix;

// اعمال افکت اکو

for (int i = 0; i < bytesRead/4; i++) {

int32_t inSample = buffer[i];

int32_t delayed = echoBuffer[echoIndex];

// مخلوط کردن و نوشتن به بافر

int32_t outSample = inSample + delayed * echoMix;

buffer[i] = outSample;

// به‌روزرسانی بافر حلقوی

echoBuffer[echoIndex] = inSample;

echoIndex = (echoIndex + 1) % echoDelay;

}

// ارسال داده به DAC

I2S.write((char*)buffer, bytesRead);

}

۵.۳. تشریح عملکرد

پتانسیومتر ولوم: روی پین آنالوگ VOL_PIN متصل شده و با خواندن مقدار 0–4095 تعیین می‌شود.
بافر حلقوی echoBuffer: صدای ورودی را ذخیره و پس از تأخیر مشخص (نیم ثانیه) دوباره مخلوط می‌کند.
نسبت اکو (echoMix): از ۰ تا %۸۰ تنظیم می‌شود و با ولوم قابل تغییر است.
حلقه پردازش: برای هر نمونه صوتی، صدای اصلی و صدای تأخیری مخلوط شده و به بافر خروجی نوشته می‌شود.

با این روش، می‌توانید سطح افکت اکو را در زمان اجرا از صفر تا حداکثر تنظیم کنید و تجربه‌ی گفتگو در سیستم کنفرانس خود را جذاب‌تر نمایید.

. تشریح عملکرد کد

Serial Monitoring: نمایش وضعیت راه‌اندازی و آماده‌باش.
I2S.begin (Rx): پیکربندی پین‌ها و پارامترهای ورودی از INMP441.
I2S.setPins + I2S.begin (Tx): پیکربندی خروجی به PCM5102.
loop(): خواندن مداوم داده صوتی و ارسال فوری برای پخش.

نکته: بهره‌گیری از DMA برای جابجایی خودکار داده‌ها بدون بار روی CPU، که منجر به تاخیر بسیار کم می‌شود.

۶. نکات پیشرفته و عیب‌یابی

جیتتر (Jitter): برای دقت بیشتر از PLL داخلی ESP32 (APLL) استفاده کنید.
Buffer Underrun/Overrun: تعداد بافرها (dma_buf_count) و طول آن‌ها (dma_buf_len) را بر اساس تاخیر قابل قبول تنظیم کنید.
تطبیق سطح ولتاژ: در صورت نیاز از مبدل سطح (Level Shifter) برای سازگاری با هدست‌ها و سیستم‌های صوتی پیچیده بهره ببرید.
نظارت بر سیگنال I2S: با استفاده از اسیلوسکوپ یا Logic Analyzer، صحت خطوط BCLK, WS و DATA را بررسی کنید.

۷. پروژه‌های پیشنهادی

سیستم کنفرانس چندنفره: افزودن میکروفون‌های اضافی و میکسر نرم‌افزاری برای هدایت هر کانال.
کنفرانس تصویری: ترکیب با ماژول ESP32-CAM و پیاده‌سازی استریم ویدئو همراه با صدا.
VOIP سخت‌افزاری: ارتباط با پروتکل SIP و پیاده‌سازی دستگاه تلفن تحت شبکه مستقل.
افکت‌های صوتی بلادرنگ: اضافه کردن افکت‌های Reverb، Echo، Pitch Shift در حلقه انتقال.

از اینکه این مطلب را تا انتها دنبال کردید سپاسگزاریم! امیدواریم با این راهنما بتوانید پروژه‌های صوتی خلاقانه‌ای بسازید. اگر به کمک بیشتری نیاز دارید یا سوالی دارید، در کامنت‌ها مطرح کنید.

منتظر خواندن نظرات شما هستیم!

علی عزتی29 تیر 1404

0 995 زمان تقریبی مطالعه 4 دقیقه