فرآیند ETL که در واقع عملیات اصلی در درست کردن انبارداده است، خود از سه قسمت تشکیل شده است. استخراج (Extract)، تبدیل (تغییرات) (Transformation) و بارگزاری (Load).
در مرحله اولی، دادهها از منابع مختلف، توسط فرآیند استخراج (Extract)، استخراج شده و در مخزنی به نام محل استقرار (Staging Area) قرار میگیرد. در واقع در مرحله استخراج داده، که مرحله اول ETL است، دادهها از منابع دادهای استخراج شده و در Staging Area ذخیره میشوند. مرحله استخراج باعث میشود دادههایی که در منابع مختلف بوده و دارای سیستم عاملهای متفاوت و ساختار بازیابی گوناگون هستند جمعآوری شوند تا بتوان بر روی آنها عملیات پردازشی را انجام داد.
مرحله دوم تبدیل (Transformation) است. این مرحله که قلب اصلی فرآیند ETL به شمار میرود در Staging Area انجام میشود تا انجام عملیات (بعضا سنگین) مزاحم انبارداده و یا منابع دادهای منبع نباشد. حتما توجه دارید که دادههایی که در منابع دادهای مختلف هستند به صورت خام ذخیره شدهاند و قبل از اینکه در انبارداده ذخیره شوند نیاز به تغییراتی دارند. با این تغییرات و تبدیلها، دادهها آماده انبار کردن میشوند. مثلا اگر بخواهید نام و نام خانوادگی یک شخص را همراه با پسوند این شخص در یک فیلد انبار کنید و هر کدام از اینها در مخزن جدایی باشد، در این مرحله (مرحله تبدیل) بایستی این تغییرات را انجام دهید.
مرحله سوم بارگزار (Load) است که دادههای تغییریافته و آماده شده توسط مرحله قبل (مرحله تبدیل-Transformation) در انبارداده بارگزاری میگردد.