Talent.com
This job offer is not available in your country.
Data Scientist _zastępstwo na ok. 12 miesięcy

Data Scientist _zastępstwo na ok. 12 miesięcy

Transition Technologies-Advanced SolutionsWarszawa, Polska
22 days ago
Job description

Jesteśmy  Transition Technologies-Science. Opiekujemy się danymi medycznymi i naszymi partnerami z sektora ochrony zdrowia.

Zespół deweloperski  tworzy specjalistyczne oprogramowanie dla ośrodków badań klinicznych, szpitali, badaczy i lekarzy. Wykorzystując najnowocześniejsze technologie IT, staramy się wspierać i ulepszać procesy badawcze, diagnostyczno-terapeutyczne oraz odkrywać wiedzę zgromadzoną w licznych bazach medycznych.

Zespół specjalistów ds. danych i statystyków  świadczy usługi Data Science, oferując wsparcie analityczne w badaniach klinicznych. Nasi eksperci przeprowadzają zaawansowane analizy z obszaru statystyki klinicznej i machine learning służące wspomaganiu procesów diagnostycznych, terapeutycznych oraz monitorowaniu jakości leczenia.

Poznaj wszystkie nasze produkty i usługi : https : / / ttsi.com.pl / ; https : / / ecrf.com /

Poza tym, że dokładamy swoje cegiełki do ważnych spraw :

jesteśmy drużyną sympatycznych i jednocześnie bardzo różnych osób,

stawiamy na koleżeńską atmosferę, współpracę opartą na zaufaniu i dialogu,

wspólnie kreujemy miejsce, w którym doświadczeni specjaliści mogą wykorzystywać wszystkie swoje umiejętności i stale poszerzać kompetencje, a juniorzy otrzymują wsparcie w budowaniu wiedzy.

Ponadto oferujemy :

  • ciekawą pracę przy różnorodnych projektach z obszaru niekomercyjnych badań klinicznych,
  • udział w projektach, nastawionych na przejrzystość, solidną walidację i pragmatyczne wykorzystanie AI – ponieważ nasze rozwiązania trafiają bezpośrednio do lekarzy i badaczy,
  • przestrzeń do inicjatywy, dużą samodzielność w realizacji powierzonych zadań,
  • współdziałanie z zespołem pasjonatów dbających o jakość i stałe ulepszanie swojej pracy,
  • współpracę w oparciu o umowę o pracę lub B2B na czas nieobecności jednej z naszych koleżanek (ok. 12 miesięcy) – z możliwością przedłużenia,

elastyczne godziny pracy – pracujemy full time, core hours (czas wspólnej pracy zespołowej) przypada na godz. 10 : 00-15 : 30, jednak możesz dopasować godziny rozpoczęcia i zakończenia pracy do swoich preferencji,

  • benefity takie jak : opieka medyczna, karta sportowa, kurs języka angielskiego,
  • możliwość pracy 🚩 w jednym z naszych biur : w Warszawie lub Ostrowie Wielkopolskim 🚩 hybrydowo lub  🚩 w 100% w trybie home office.
  • Jako Data Scientist będziesz :

    współpracował w małym interdyscyplinarnym zespole obejmującym specjalistów z zakresu data science, deweloperów, klinicystów,

  • dokumentował i dzielił się wiedzą (raporty markdown, Shiny, Jupyter),
  • miał okazję włączyć się w prace nad jednym z projektów dla Regionalnych Centrów Medycyny Cyfrowej :
  • Budowy generatora danych syntetycznych umożliwiającego szpitalom bezpieczne testowanie algorytmów bez udostępniania danych wrażliwych. W ramach tego projektu będziesz :

  • projektował i implementował algorytmy generowania danych syntetycznych (CTGAN, Python / R, SDV / Synthpop) - by precyzyjnie odwzorować statystyki i strukturę prawdziwych danych medycznych, zapewniając jednocześnie prywatność generowanych informacji,
  • zapewniał integrację kodu z Dockerem, rozwijał i utrzymywał testy automatyczne oraz wdrażał procesy CI / CD;
  • Budowy środowiska do rozproszonej analizy danych - bezpiecznej i skalowalnej platformy, która umożliwi badaczom przeprowadzanie złożonych analiz danych on-premise lub w chmurze. W ramach tego projektu będziesz :

  • projektować i konfigurować architekturę ww. platformy, w tym klastry Kubernetes,
  • odpowiadać za orkiestrację i skalowanie zadań analitycznych,
  • zarządzać bezpieczeństwem platformy, wdrażając systemy autoryzacji i mechanizmy bezpiecznego uruchamiania kodu;
  • Rozwoju pipelinu ekstrakcji kluczowych informacji z nieustrukturyzowanej dokumentacji medycznej, wykorzystującego potencjał Dużych Modeli Językowych (LLM). W ramach tego projektu będziesz :

  • wybierać, dostosowywać i wdrażać modele LLM, zarządzając całym ich cyklem życia (MLOps),
  • zapewniać zgodność i jakość danych poprzez rygorystyczną walidację anonimizacji i precyzji ekstrakcji, z dbałością o zgodność z RODO.
  • Stanowisko będzie dla Ciebie idealne, jeżeli :

    posiadasz min. 3 lata produkcyjnego doświadczenia w kodowaniu w R lub Pythonie, w tym z bibliotekami takimi jak Pandas / Tidyverse oraz np. tidymodels / Scikit-learn / PyTorch,

  • znasz się na konteneryzacji, potrafisz budować obrazy Dockerowe, korzystać z Docker Compose i masz podstawową wiedzę o sieciach w Dockerze,
  • na co dzień pracujesz z systemem Git, aktywnie uczestnicząc w procesach pull request i code review,
  • swobodnie komunikujesz się w języku angielskim (min. B2+),
  • potrafisz efektywnie i lubisz pracować w zespole,
  • aktywnie pogłębiasz swoją wiedzę i chętnie dzielisz się nią z innymi.
  • Mile nas zaskoczysz, jeśli dodatkowo możesz pochwalić się :

  • doświadczeniem w pracy z narzędziami do generowania danych syntetycznych (np. Synthpop, SDV, CTGAN) lub jesteś gotów szybko się ich nauczyć,
  • znajomością Kubernetes, Helm oraz doświadczeniem w pracy z chmurą (AWS / Azure / GCP),
  • znajomością narzędzi AI-assisted coding (np.  Cursor, GitHub Copilot),

  • udziałem w hackathonach lub projektach open-source,
  • podstawami MLOps (MLflow, DVC, testy danych).
  • Proces rekrutacyjny w TT-SI prowadzony jest w całości zdalnie via Teams.

    Zakłada 3 etapy : 1️⃣ Rozmowę wstępną ze Specjalistą ds. HR. 2️⃣ Rozmowę techniczną (Python / R, Docker, case study).   3️⃣ Rozmowę z liderem projektu.

    Uprzejmie informujemy, że skontaktujemy się z wybranymi kandydatami.

    Wymagania

    Oczekujemy

    Oferujemy

    Create a job alert for this search

    Data Scientist • Warszawa, Polska