ΠΠΎΡΠ°Π±ΠΎΡΠΊΠ° ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠ΅Π³ΠΎ ΠΏΡΠΎΠ΄ΡΠΊΡΠ°, Π½Π°ΡΡΡΠΎΠΉΠΊΠ°, ΡΠ΅ΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅. ΠΠ±ΡΠ·Π°Π½Π½ΠΎΡΡΠΈ: β’ Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅, Π½Π°ΡΡΡΠΎΠΉΠΊΠ° ΠΈ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ETL ΠΈ ELT β ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ². β’ ΠΠΎΠ½ΠΈΡΠΎΡΠΈΠ½Π³ ΡΠ°Π±ΠΎΡΡ Π°Π½Π°Π»ΠΈΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΊΠΎΠ½ΡΡΡΠ° ΠΠΠ‘ ΠΠΠ₯. β’ ΠΠΎΠ½ΡΡΠΎΠ»Ρ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° Π΄Π°Π½Π½ΡΡ
, ΠΎΡΠΈΡΡΠΊΠ° Π΄Π°Π½Π½ΡΡ
. β’ ΠΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ΠΎΠ² ΠΏΠΎΡΠΎΠΊΠΎΠ² Π΄Π°Π½Π½ΡΡ
. β’ Π Π°Π·ΡΠ°Π±ΠΎΡΠΊΠ° ΠΈ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΠΠ-ΡΠ΅ΡΠ²ΠΈΡΠΎΠ², API ΠΈ CLI Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ. β’ ΠΠ°ΠΏΠΈΡΠ°Π½ΠΈΠ΅ SQL Π·Π°ΠΏΡΠΎΡΠΎΠ² ΠΊ ΠΠ. β’ ΠΠ°ΠΏΠΈΡΠ°Π½ΠΈΠ΅ ΠΊΠΎΠ΄Π° Π½Π° Python Π² ETL - ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°Ρ
(Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, DAG Apache Airflow ΠΈ ΠΏΡ). β’ Π£ΡΠ°ΡΡΠΈΠ΅ Π² ΡΠΎΠ·Π΄Π°Π½ΠΈΠΈ, ΠΎΠΏΠΈΡΠ°Π½ΠΈΠΈ, ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ ΠΈ Π΄ΠΎΡΠ°Π±ΠΎΡΠΊΠ΅ ΡΡΡΡΠΊΡΡΡ Ρ
ΡΠ°Π½Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ
. β’ Π£ΡΠ°ΡΡΠΈΠ΅ Π² Π°Π΄ΠΌΠΈΠ½ΠΈΡΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ ΡΠ°Π±ΠΎΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ
Π‘Π£ΠΠ. β’ ΠΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ° Π°Π½Π°Π»ΠΈΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΠΎΠ² Π² ΡΠ°ΡΡΠΈ ΡΠ°Π±ΠΎΡΡ ETL β ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ². β’ ΠΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ° ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΏΠΎ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ ΠΈ ΡΠΎΠ²Π΅ΡΡΠ΅Π½ΡΡΠ²ΠΎΠ²Π°Π½ΠΈΡ ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠΈΡ
ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ² ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΠΌΠΈ. Π’ΡΠ΅Π±ΠΎΠ²Π°Π½ΠΈΡ: β’ ΠΠ»ΡΠ±ΠΎΠΊΠΈΠ΅ Π·Π½Π°Π½ΠΈΡ ΠΈ ΠΎΠΏΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΡΠ°ΠΊΠΈΡ
ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ²: Apache Kafka, Apache Airflow, Apache Nifi, Debezium β’ ΠΠ½Π°Π½ΠΈΠ΅ ΠΎΡΠ½ΠΎΠ² ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π±Π°Π· Π΄Π°Π½Π½ΡΡ
(ΠΎΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Ρ Π‘Π£ΠΠ PostgreSQL, ClickHouse, Greenplum) β’ ΠΠ½Π°Π½ΠΈΠ΅ ΠΎΡΠ½ΠΎΠ² ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π°Π½Π°Π»ΠΈΡΠΈΡΠ΅ΡΠΊΠΈΡ
Ρ
ΡΠ°Π½ΠΈΠ»ΠΈΡ (Data Warehouse) β’ Π£Π²Π΅ΡΠ΅Π½Π½ΡΠ΅ Π·Π½Π°Π½ΠΈΡ SQL β’ Π£Π²Π΅ΡΠ΅Π½Π½ΡΠ΅ Π·Π½Π°Π½ΠΈΡ Python. ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°ΠΌΠΈ Pandas, NumPy, SciPy ΠΈ Π΄Ρ. β’ ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Ρ ΠΠ‘ Windows ΠΈ Linux. β’ Π£ΠΌΠ΅Π½ΠΈΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ Π»ΡΠ±ΡΠΌΠΈ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ
, Π² ΡΠΎΠΌ ΡΠΈΡΠ»Π΅ Π½Π΅ ΡΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΡΠΌΠΈ, Π·Π°Π³ΡΡΠΆΠ°ΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ Ρ ΠΠΠ ΡΠ°ΠΉΡΠΎΠ², FTP ΡΠ΅ΡΠ²Π΅ΡΠΎΠ², ΠΏΠ°ΡΡΠΈΡΡ HTML, XML, Π·Π°Π³ΡΡΠΆΠ°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΈΠ· MS Excel ΠΈ ΠΏΡ. β’ ΠΠ½Π°Π»ΠΈΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΌΡΡΠ»Π΅Π½ΠΈΠ΅, ΡΠΌΠ΅Π½ΠΈΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ Π±ΠΎΠ»ΡΡΠΈΠΌΠΈ ΠΎΠ±ΡΠ΅ΠΌΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ
ΠΡΠ΄Π΅Ρ ΠΏΠ»ΡΡΠΎΠΌ: β’ ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Pentaho Data Integration, β’ ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ ΡΠΎ Spark, Livi, β’ ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Ρ BI - ΡΠΈΡΡΠ΅ΠΌΠ°ΠΌΠΈ. β’ ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Π² ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΠΠ΅Π³Π°Π€ΠΎΠ½.