This job offer is not available in your country.

Data Scientist _zastępstwo na ok. 12 miesięcy

Transition Technologies-Advanced SolutionsWarszawa, Polska

23 days ago

Job description

Jesteśmy Transition Technologies-Science. Opiekujemy się danymi medycznymi i naszymi partnerami z sektora ochrony zdrowia.

Zespół deweloperski tworzy specjalistyczne oprogramowanie dla ośrodków badań klinicznych, szpitali, badaczy i lekarzy. Wykorzystując najnowocześniejsze technologie IT, staramy się wspierać i ulepszać procesy badawcze, diagnostyczno-terapeutyczne oraz odkrywać wiedzę zgromadzoną w licznych bazach medycznych.

Zespół specjalistów ds. danych i statystyków świadczy usługi Data Science, oferując wsparcie analityczne w badaniach klinicznych. Nasi eksperci przeprowadzają zaawansowane analizy z obszaru statystyki klinicznej i machine learning służące wspomaganiu procesów diagnostycznych, terapeutycznych oraz monitorowaniu jakości leczenia.

Poznaj wszystkie nasze produkty i usługi : https : / / ttsi.com.pl / ; https : / / ecrf.com /

Poza tym, że dokładamy swoje cegiełki do ważnych spraw :

jesteśmy drużyną sympatycznych i jednocześnie bardzo różnych osób,

stawiamy na koleżeńską atmosferę, współpracę opartą na zaufaniu i dialogu,

wspólnie kreujemy miejsce, w którym doświadczeni specjaliści mogą wykorzystywać wszystkie swoje umiejętności i stale poszerzać kompetencje, a juniorzy otrzymują wsparcie w budowaniu wiedzy.

Ponadto oferujemy :

ciekawą pracę przy różnorodnych projektach z obszaru niekomercyjnych badań klinicznych,
udział w projektach, nastawionych na przejrzystość, solidną walidację i pragmatyczne wykorzystanie AI – ponieważ nasze rozwiązania trafiają bezpośrednio do lekarzy i badaczy,
przestrzeń do inicjatywy, dużą samodzielność w realizacji powierzonych zadań,
współdziałanie z zespołem pasjonatów dbających o jakość i stałe ulepszanie swojej pracy,
współpracę w oparciu o umowę o pracę lub B2B na czas nieobecności jednej z naszych koleżanek (ok. 12 miesięcy) – z możliwością przedłużenia,

elastyczne godziny pracy – pracujemy full time, core hours (czas wspólnej pracy zespołowej) przypada na godz. 10 : 00-15 : 30, jednak możesz dopasować godziny rozpoczęcia i zakończenia pracy do swoich preferencji,

benefity takie jak : opieka medyczna, karta sportowa, kurs języka angielskiego,

możliwość pracy 🚩 w jednym z naszych biur : w Warszawie lub Ostrowie Wielkopolskim 🚩 hybrydowo lub 🚩 w 100% w trybie home office.

Jako Data Scientist będziesz :

współpracował w małym interdyscyplinarnym zespole obejmującym specjalistów z zakresu data science, deweloperów, klinicystów,

dokumentował i dzielił się wiedzą (raporty markdown, Shiny, Jupyter),

miał okazję włączyć się w prace nad jednym z projektów dla Regionalnych Centrów Medycyny Cyfrowej :

Budowy generatora danych syntetycznych umożliwiającego szpitalom bezpieczne testowanie algorytmów bez udostępniania danych wrażliwych. W ramach tego projektu będziesz :

projektował i implementował algorytmy generowania danych syntetycznych (CTGAN, Python / R, SDV / Synthpop) - by precyzyjnie odwzorować statystyki i strukturę prawdziwych danych medycznych, zapewniając jednocześnie prywatność generowanych informacji,

zapewniał integrację kodu z Dockerem, rozwijał i utrzymywał testy automatyczne oraz wdrażał procesy CI / CD;

Budowy środowiska do rozproszonej analizy danych - bezpiecznej i skalowalnej platformy, która umożliwi badaczom przeprowadzanie złożonych analiz danych on-premise lub w chmurze. W ramach tego projektu będziesz :

projektować i konfigurować architekturę ww. platformy, w tym klastry Kubernetes,

odpowiadać za orkiestrację i skalowanie zadań analitycznych,

zarządzać bezpieczeństwem platformy, wdrażając systemy autoryzacji i mechanizmy bezpiecznego uruchamiania kodu;

Rozwoju pipelinu ekstrakcji kluczowych informacji z nieustrukturyzowanej dokumentacji medycznej, wykorzystującego potencjał Dużych Modeli Językowych (LLM). W ramach tego projektu będziesz :

wybierać, dostosowywać i wdrażać modele LLM, zarządzając całym ich cyklem życia (MLOps),

zapewniać zgodność i jakość danych poprzez rygorystyczną walidację anonimizacji i precyzji ekstrakcji, z dbałością o zgodność z RODO.

Stanowisko będzie dla Ciebie idealne, jeżeli :

posiadasz min. 3 lata produkcyjnego doświadczenia w kodowaniu w R lub Pythonie, w tym z bibliotekami takimi jak Pandas / Tidyverse oraz np. tidymodels / Scikit-learn / PyTorch,

znasz się na konteneryzacji, potrafisz budować obrazy Dockerowe, korzystać z Docker Compose i masz podstawową wiedzę o sieciach w Dockerze,

na co dzień pracujesz z systemem Git, aktywnie uczestnicząc w procesach pull request i code review,

swobodnie komunikujesz się w języku angielskim (min. B2+),

potrafisz efektywnie i lubisz pracować w zespole,

aktywnie pogłębiasz swoją wiedzę i chętnie dzielisz się nią z innymi.

Mile nas zaskoczysz, jeśli dodatkowo możesz pochwalić się :

doświadczeniem w pracy z narzędziami do generowania danych syntetycznych (np. Synthpop, SDV, CTGAN) lub jesteś gotów szybko się ich nauczyć,

znajomością Kubernetes, Helm oraz doświadczeniem w pracy z chmurą (AWS / Azure / GCP),

znajomością narzędzi AI-assisted coding (np. Cursor, GitHub Copilot),

udziałem w hackathonach lub projektach open-source,

podstawami MLOps (MLflow, DVC, testy danych).

Proces rekrutacyjny w TT-SI prowadzony jest w całości zdalnie via Teams.

Zakłada 3 etapy : 1️⃣ Rozmowę wstępną ze Specjalistą ds. HR. 2️⃣ Rozmowę techniczną (Python / R, Docker, case study). 3️⃣ Rozmowę z liderem projektu.

Uprzejmie informujemy, że skontaktujemy się z wybranymi kandydatami.

Wymagania

Oczekujemy

Oferujemy

Create a job alert for this search

Data Scientist • Warszawa, Polska