Data Science. Π Π°Π·ΡΠ°Π±ΠΎΡΠΊΠ° Ρ Π½ΡΠ»Ρ. ΠΡΡ Python-ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠ° Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΡΠΈΡΡΠ΅ΠΌΡ ΡΡΠ°Π²Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π²ΡΡ
ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² Π΄Π°Π½Π½ΡΡ
β ΠΏΠΎΠ»Π΅ΠΉ ΠΠ SQLite ΠΈ Excel. ΠΠ°Π΄Π°ΡΠ°: - Π°Π²ΡΠΎΠΌΠ°ΡΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ cΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ»Π΅ΠΉ ΠΠ (Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΡΠ΅ ΡΠ°Π±Π»ΠΈΡΡ: Π³ΡΡΠΏΠΏΠ°, Π°Π»ΡΠ±ΠΎΠΌ, Π»Π΅ΠΉΠ±Π», ΡΡΡΠ°Π½Π°, ΠΊΠ°Ρ.Π½ΠΎΠΌΠ΅Ρ, Π΄Π°ΡΠ°/Π³ΠΎΠ΄ ΠΈ ΡΡΡΠ°Π½Π° ΡΠ΅Π»ΠΈΠ·Π°) Ρ Π΄Π°Π½Π½ΡΠΌΠΈ Excel (Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΎΠΊ, ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅ β Π½Π΅ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅) - ΠΏΡΠΎΠ²ΠΎΠ΄ΠΈΡΡ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΡΠΈΠΎΡΠΈΡΠ΅ΡΠ½ΡΡ
ΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΠΉ ΠΏΠΎ ΡΠ΅ΠΉΡΠΈΠ½Π³Ρ ΠΈ ΡΠ΅Π½Π΅. Π’Π΅Ρ
Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ: - Python 3.10+ (pandas, numpy, sqlite3) - Fuzzy matching (rapidfuzz/fuzzywuzzy ΠΈΠ»ΠΈ sentence-transformers) - SQLite - Excel Π’ΡΠ΅Π±ΠΎΠ²Π°Π½ΠΈΡ ΠΊ ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΡ: - ΠΠΏΡΡ pandas/SQLite - ΠΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ fuzzy string matching (rapidfuzz, Levenshtein) - ΠΠ°Π²ΡΠΊΠΈ data preprocessing (ΡΠ΅Π³ΡΠ»ΡΡΠΊΠΈ, ΠΎΡΠΈΡΡΠΊΠ° ΡΠ΅ΠΊΡΡΠ°) - ΠΠΏΡΡ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΏΠΎ Π²Π΅ΡΠΎΠ²ΡΠΌ ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½ΡΠ°ΠΌ - ΠΠ΅Π»Π°ΡΠ΅Π»ΡΠ½ΠΎ: ML (sentence embeddings).