Senior Data Engineer (Spark)
Miejsce pracy : Wrocław
Technologies we use
Expected
Optional
JavaScalaKubeflowMLFlowDatabricksKafkaKubernetesIcebergTerraformOperating system
WindowsmacOSAbout the project
As a Senior Data Engineer, you will have the exciting opportunity to work with a team of technology experts on challenging projects across various industries, leveraging cutting-edge technologies. Here are some of the projects we are seeking talented individuals to join :
Development and maintenance of a large platform for processing automotive data. A significant amount of data is processed in both streaming and batch modes. The technology stack includes Spark, Cloudera, Airflow, Iceberg, Python, and AWS.Design and development of a universal data platform for global aerospace companies. This Azure and Databricks powered initiative combines diverse enterprise and public data sources. The data platform is at the early stages of the development, covering design of architecture and processes as well as giving freedom for technology selection.Centralized reporting platform for a growing US telecommunications company. This project involves implementing BigQuery and Looker as the central platform for data reporting. It focuses on centralizing data, integrating various CRMs, and building executive reporting solutions to support decision-making and business growth.Your responsibilities
Develop and maintain a high-performance data processing platform for automotive data, ensuring scalability and reliability.Design and implement data pipelines that process large volumes of data in both streaming and batch modes.Optimize data workflows to ensure efficient data ingestion, processing, and storage using technologies such as Spark, Cloudera, and Airflow.Work with data lake technologies (e.g., Iceberg) to manage structured and unstructured data efficiently.Collaborate with cross-functional teams to understand data requirements and ensure seamless integration of data sources.Monitor and troubleshoot the platform, ensuring high availability, performance, and accuracy of data processing.Leverage cloud services (AWS) for infrastructure management and scaling of processing workloads.Write and maintain high-quality Python (or Java / Scala) code for data processing tasks and automation.Our requirements
At least 5 years of commercial experience implementing, developing, or maintaining Big Data systems, data governance and data management processes.Strong programming skills in Python (or Java / Scala) : writing a clean code, OOP design.Hands-on with Big Data technologies like Spark, Cloudera, Data Platform, Airflow, NiFi, Docker, Kubernetes, Iceberg, Hive, Trino or Hudi.Excellent understanding of dimensional data and data modeling techniques.Experience implementing and deploying solutions in cloud environments.Consulting experience with excellent communication and client management skills, including prior experience directly interacting with clients as a consultant.Ability to work independently and take ownership of project deliverables.Fluent in English (at least C1 level).Bachelor’s degree in technical or mathematical studies.Optional
Experience with an MLOps framework such as Kubeflow or MLFlow.Familiarity with Databricks, dbt or Kafka.This is how we organize our work
This is how we work
in houseyou can change the projectyou have influence on the choice of tools and technologiesyou have influence on the technological solutions appliedyou have influence on the productyou develop the code "from scratch"you focus on product developmentagilescrumTeam members
technical leaderbig data developerdata scientistproject managerDevelopment opportunities we offer
assistance in preparation to public speechesconferences abroadconferences in Polanddevelopment budgetexternal trainingindustry-specific e-learning platformsintracompany trainingsoft skills trainingsubstantive support from technological leaderssupport of IT eventstechnical knowledge exchange within the companytime for development of your ideasWhat we offer
Work in a supportive team of passionate enthusiasts of AI & Big Data.Engage with top-tier global enterprises and cutting-edge startups on international projects.Enjoy flexible work arrangements, allowing you to work remotely or from modern offices and coworking spaces.Accelerate your professional growth through career paths, knowledge-sharing initiatives, language classes, and sponsored training or conferences, including a partnership with Databricks, which offers industry-leading training materials and certifications.Choose from various employment options : B2B, employment contracts, or contracts of mandate.Make use of 20 fully paid days off available for B2B contractors and individuals under contracts of mandate.Participate in team-building events and utilize the integration budget.Celebrate work anniversaries, birthdays, and milestones.Access medical and sports packages, eye care, and well-being support services, including psychotherapy and coaching.Get full work equipment for optimal productivity, including a laptop and other necessary devices.With our backing, you can boost your personal brand by speaking at conferences, writing for our blog, or participating in meetups.Experience a smooth onboarding with a dedicated buddy, and start your journey in our friendly, supportive, and autonomous culture.Benefits
sharing the costs of sports activitiesprivate medical caresharing the costs of professional training & coursesremote work opportunitiesflexible working timeintegration eventsno dress codevideo games at workchristmas giftsbirthday celebrationemployee referral programReimbursement for prescription glasses or contact lensesRecruitment stages
Let's get to know each other (45 min)Technical Interview (1h)Management Interview (1h)Addepto
Addepto is a leading consulting and technology company specializing in AI and Big Data, helping clients deliver innovative data projects. We partner with top-tier global enterprises and pioneering startups, including Rolls Royce, Continental, Porsche, ABB, and WGU. Our exclusive focus on AI and Big Data has earned us recognition by Forbes as one of the top 10 AI consulting companies.
Klikając w przycisk „Aplikuj” lub w inny sposób wysyłając zgłoszenie rekrutacyjne, zgadzasz się na przetwarzanie Twoich danych osobowych przez ADDEPTO sp. z o.o. z siedzibą w : Świeradowska 47, 02-662 Warszawa (Pracodawca), jako administratora danych osobowych w celu przeprowadzenia rekrutacji na stanowisko wskazane w ogłoszeniu.
Twoje dane osobowe będą przetwarzane w oparciu o następujące podstawy prawne : (a) aby podjąć działania na Twoje żądanie przed zawarciem umowy (np. informacje o oczekiwanym wynagrodzeniu i dostępności do rozpoczęcia pracy); (b) w oparciu o nasz prawnie uzasadniony interes (np. imię, nazwisko, data urodzenia, dane kontaktowe, wykształcenie, kwalifikacje zawodowe, przebieg dotychczasowego zatrudnienia); c) w oparciu o Twoją zgodę, która wyrażona jest poprzez przeslanie dokumentów aplikacyjnych zawierających takie informacje jak np. wizerunek czy zainteresowania. Podanie wszystkich danych osobowych, o których mowa powyżej jest dobrowolne, natomiast dane wymienione w lit. a) i b) są niezbędne do wzięcia udziału w rekrutacji. Niepodanie danych skutkuje brakiem możliwości rozpatrzenia kandydatury. Podanie pozostałych danych jest dobrowolne, ale może pomóc w sprawnym przeprowadzeniu procesu rekrutacji. Masz prawo żądać dostępu do Twoich danych (w tym uzyskania ich kopii), sprostowania danych, ich usunięcia, ograniczenia przetwarzania, przeniesienia, jak również wniesienia sprzeciwu wobec ich przetwarzania. Masz także prawo wniesienia skargi do Prezesa Urzędu Ochrony Danych Osobowych. Twoje dane osobowe mogą zostać przekazane dostawcom usługi publikacji ogłoszeń o pracę, dostawcom systemów do zarządzania rekrutacjami, dostawcom usług IT (hosting), dostawcom systemów informatycznych. Podane przez Ciebie dane osobowe nie będą wykorzystywane w celu profilowania albo podejmowania decyzji w sposób zautomatyzowany. Twoje dane osobowe będą przetwarzane przez okres maks. 1 roku od zakończenia publikacji ogłoszenia, chyba, że wyraziłeś odrębną zgodę na wykorzystanie Twoich danych osobowych w przyszłych rekrutacjach. W celu realizacji praw lub w przypadku jakichkolwiek pytań związanych z przetwarzaniem Twoich danych osobowych skontaktuj się z nami pod adresem : hr@addepto.com.