Databricks Asset Bundles: stabiele configuratie van jouw workspaces

Databricks Asset Bundles: Stabiele configuratie van jouw workspaces

AuteurDélano GaasbeekFunctieData Engineer

Tag(s)

Expert Databricks

Binnen het data landschap zien we bij onze klanten vaak dezelfde uitdagingen terugkomen. Het ontsluiten van enkele databronnen is één ding; dit schaalbaar en gestandaardiseerd doen is een heel ander verhaal. Hoe zorg je ervoor dat je datastromen en de benodigde infrastructuur stabiel in productie krijgt? En hoe gaat dit in zijn werk wanneer er meerdere developers – laat staan developer teams – tegelijk bezig zijn dit voor elkaar te krijgen?

Een belangrijk deel van het antwoord ligt bij Databricks; de go-to voor organisaties waar meerdere developers – of zelfs meerdere developer teams – verantwoordelijk zijn voor het ontsluiten van data en het creëren van data producten.
Daarbij zijn Databricks Asset Bundles (DABs) je beste vriend: een tool om data pipelines en bijbehorende resources as-code te configureren – vergelijkbaar met Infrastructure-as-Code, maar dan voor je data. Deze bundles kunnen vervolgens eenvoudig geïntegreerd worden met CI pipelines, om van omgeving naar omgeving te kunnen deployen. Met DABs leg je de basis voor gestandaardiseerde, herhaalbare en schaalbare deployments van je Databricks-omgevingen – en precies dát maakt het verschil tussen proof-of-concept en productie.

Wat zijn Databricks Asset Bundles?

Met Databricks Asset Bundles (DABs) configureer je op een declaratieve manier welke resources je nodig hebt en waar ze moeten draaien. Welke notebooks vormen samen een job? Met andere woorden; welke stukjes code vormen samen de pipeline die rauwe data omvormt tot data producten die waarde leveren voor de business? Welke clusters zijn er nodig om deze pipelines op te draaien? Welke omgevingen hebben we en welke jobs horen op welke omgeving te draaien?

De declaratieve manier waarop je DABs configureert, verzekert een eenvoudige, schaalbare en repliceerbare oplossing voor al deze vragen. Declaratief betekent dat je niet de stappen beschrijft om resources te koppelen en te deployen, maar alleen de gewenste eindtoestand. Ter illustratie; je beschrijft simpelweg welke notebooks op welke volgorde er samen voor zorgen dat rauwe financiële data uit bron A in een bruikbare kwartaalrapportage gegoten wordt. Je configureert welk cluster deze berekeningen uit moet voeren én op welke Databricks omgeving je deze job wenst uit te voeren. Een eenvoudig ‘deploy’ commando van de Databricks CLI zorgt vervolgens voor de automatische provisioning en updates.

Waarom provisioning met DABs?

Snel en herhaalbaar opzetten van omgevingen
DABs maken het mogelijk om volledige Databricks workspaces — inclusief code, configuratie en infrastructuur — in één keer te deployen. Zo staat een nieuwe omgeving in minuten klaar, in plaats van uren of dagen.
Consistente en foutloze deployments
Door te werken met ‘infrastructure-as-code’ zijn alle omgevingen gelijk ingericht. Dit voorkomt menselijke fouten en zorgt ervoor dat ontwikkel-, test- en productieomgevingen synchroon blijven.
Eenvoudige promotie tussen omgevingen
Met slechts één commando kan code worden gepromoveerd van ontwikkel naar test, acceptatie of productie. Geen handmatige stappen meer — wél betrouwbaarheid en snelheid.
Naadloze integratie met CI/CD pipelines
Bundles kunnen direct worden geïntegreerd in bestaande CI/CD-processen. Zo kunnen jobs automatisch getest en uitgerold worden via de CLI, zonder tussenkomst van engineers.
Meer focus voor data engineers
Minder tijd kwijt aan infrastructuur, meer tijd voor het bouwen van stabiele, waardevolle data producten. Automatisering neemt het repetitieve werk uit handen.
Standaardisatie voor platform teams
DABs brengen een uniforme werkwijze tussen teams. Dat maakt het platform schaalbaar, onderhoudbaar en eenvoudig te beheren.
Transparantie en governance
Alle configuraties liggen vast in versiebeheer. Zo is altijd inzichtelijk wie wat heeft aangepast, waar en wanneer. Dit vergroot de controle over deployments en versterkt vertrouwen bij stakeholders.

Hoe Blenddata helpt bij provisioning met DABs

Zoals bewezen bij verschillende klanten is Blenddata dé kennispartner voor het inrichten en automatiseren van jouw Databricks omgevingen. Zo hebben we een van onze klanten succesvol geholpen bij het migreren van een Dataiku platform naar een Databricks platform, waardoor kosten gedrukt zijn én stabiliteit van de data toe is genomen. Een andere tevreden klant is een grote financiële dienstverlener, waar we vanaf het begin hebben meegebouwd aan een robuust Databricks platform waar meer dan 10 teams op dagelijke basis honderden datastromen draaien. We denken met jou mee en zoeken samen naar de beste oplossing voor jouw organisatie.

Databricks Asset Bundles: Stabiele configuratie van jouw workspaces

Tag(s)

Tag(s)

Wat zijn Databricks Asset Bundles?

Waarom provisioning met DABs?

Hoe Blenddata helpt bij provisioning met DABs

Samenvatting & vervolgstap

Heeft jouw bedrijf ook behoefte aan stabiele data producten?

Roel Smits

Navigatie

Sectoren

Oplossingen

Volg ons

Adres