Opis projektu :
Praca przy dużej platformie administracyjnej z zakresu ochrony zdrowia, dedykowanej sektorowi publicznemu. Projekt obejmuje rozwój i wdrażanie zaawansowanych modeli uczenia maszynowego oraz analizę dużych zbiorów danych pochodzących z systemów e-zdrowia i administracji publicznej.
Rola i obowiązki :
Projektowanie, implementacja i wdrażanie modeli ML wykorzystujących biblioteki scikit-learn, XGBoost i MLLib.
Przetwarzanie dużych zbiorów danych przy użyciu PySpark.
Budowa pipeline’ów i orkiestracja procesów za pomocą Apache Airflow.
Monitorowanie i śledzenie eksperymentów ML z MLFlow.
Współpraca z zespołami analityków, programistów oraz specjalistów dziedzinowych.
Optymalizacja modeli i ich parametrów.
Dokumentacja prowadzonych prac.
Technologie :
Python, scikit-learn, XGBoost, MLLib
PySpark
Apache Airflow
MLFlow
Systemy kontroli wersji (Git)
Programista • Warszawa, Polska