<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	>

<channel>
	<title>42 Versions of the Truth</title>
	<atom:link href="http://blog.grey-matter.nl/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.grey-matter.nl</link>
	<description>Over data en informatie</description>
	<pubDate>Wed, 15 Jul 2009 07:10:17 +0000</pubDate>
	<generator>http://wordpress.org/?v=abc</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Het architectuurproces, BI style</title>
		<link>http://blog.grey-matter.nl/het-architectuurproces-bi-style/</link>
		<comments>http://blog.grey-matter.nl/het-architectuurproces-bi-style/#comments</comments>
		<pubDate>Fri, 03 Jul 2009 13:00:11 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[architectuur]]></category>

		<category><![CDATA[business intelligence]]></category>

		<category><![CDATA[architectuurproces]]></category>

		<category><![CDATA[niet-functionele eisen]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=101</guid>
		<description><![CDATA[“Als je alleen een hamer hebt, ziet alles eruit als een spijker” - Abraham Maslow
Is het de onvolwassenheid van het vakgebied, of toch een soort beroepsdeformatie? Hoe dan ook: het behoort tot de folklore van BI-land dat inhoudelijke discussies gemakkelijk uitdraaien op een jacht op de technisch-inhoudelijke “single version of the truth”. Voor- en tegenstanders [...]]]></description>
			<content:encoded><![CDATA[<p><em>“Als je alleen een hamer hebt, ziet alles eruit als een spijker” - Abraham Maslow</em></p>
<p>Is het de onvolwassenheid van het vakgebied, of toch een soort beroepsdeformatie? Hoe dan ook: het behoort tot de folklore van BI-land dat inhoudelijke discussies gemakkelijk uitdraaien op een jacht op de technisch-inhoudelijke “single version of the truth”. Voor- en tegenstanders <span id="more-101"></span> voeren strijd over zaken als de juiste datamodelleertechniek, het aantal lagen dat je in een datawarehouse-architectuur kan, mag of moet onderkennen, de vraag of operationele systemen wel of geen BI-capabilities mogen bevatten (en of dat dan BI mag of moet heten), en ga zo maar door – vaak vanuit een impliciete gedachtengang dat er maar één goed antwoord is op iedere architectuurvraag.</p>
<h3>Architectuurproces</h3>
<p>Zolang het om wat vrijblijvend gediscussieer gaat, is dat niet zo erg. Maar het architectuurproces in concrete projecten ziet er helaas vaak niet veel anders uit. In mijn ervaring worden architectuurkeuzes eerder bepaald door de voorkeur en stijl van de architect in charge, dan door de specifieke eisen die de organisatie stelt aan zijn BI-omgeving. En het komt al helemaal zelden voor dat architectuurkeuzes gedurende de life cycle van het systeem gereviewd en bijgesteld worden om eventuele gewijzigde eisen te kunnen bedienen.</p>
<p>Goed beschouwd is dat een nogal contraproductieve manier van architectuur bedrijven. Vrijwel iedere aanpak, methode of techniek die ooit bedacht is, heeft wel ergens zijn nut en toepasbaarheid; de kunst is om te begrijpen welke aanpak je in welke omstandigheden het beste kunt volgen.</p>
<h3>Niet-functionele eisen</h3>
<p>Om de juiste aanpak te bepalen, moet de architect vraag en aanbod tegen elkaar afwegen: enerzijds moet hij weten welke alternatieven er voorhanden zijn en wat hun sterke en zwakke punten zijn, anderzijds moet hij weten welke eisen de omgeving stelt aan de oplossing. We hebben het dan niet alleen over functionele eisen: juist voor architectuurkeuzes zijn de <a href="http://en.wikipedia.org/wiki/Non-functional_requirements">niet-functionele eisen</a> de belangrijkste driver.</p>
<p>Deze afweging zie ik in BI-projecten maar zelden gemaakt worden. Mindset speelt daarbij een grote rol: wie zich niet realiseert dat niet-functionele eisen voor iedere BI-omgeving verschillend kunnen zijn, zal daar geen ook energie in steken. En een <i>one trick pony</i>-architect zal uit zichzelf geen vraagtekens zetten bij de toepasbaarheid van dat ene truukje (ook al moet hij zich af en toe in de raarste bochten wringen om dat truukje toch maar tegen heug en meug te kunnen blijven gebruiken).</p>
<p>Voor architecten met een breder repertoire kan het ontbreken van inzicht in de toepassingskarakteristieken van relevante alternatieven een probleem vormen. Over de sterke kanten van een oplossing is meestal genoeg te vinden, maar de zwakke kanten blijven nog weleens onderbelicht. (Dat is overigens niet altijd een kwestie van onwil of verkooptactiek: vaak worden de nadelen pas duidelijk nadat een oplossing eerst een paar keer in verschillende omstandigheden is toegepast).</p>
<h3>Professionalisering</h3>
<p>Er vallen dus nog wel een paar slagen te maken in de verdere professionalisering van het BI-architectuurproces.<br />
Om te beginnen moeten we ons de terminologie en het gedachtegoed van niet-functionele eisen eigen maken. We hoeven dat wiel niet zelf uit te vinden, maar kunnen de kunst afkijken bij aanpalende IT-disciplines: een kwaliteitsmodel als <a href="http://en.wikipedia.org/wiki/ISO_9126">ISO 9126</a>, of het daarop gebaseerde <a href="http://www.cibit.nl/site.nsf/page/ict_expertise_architectuur_kwaliteitseisen">Quint</a> zou (wellicht met enige aanpassing) prima onderdeel kunnen gaan uitmaken van de BI body of knowledge.</p>
<p>Verder moet het boven tafel krijgen van de niet-functionele eisen een vast onderdeel van het BI-architectuurproces worden.<br />
(Het zou evident moeten zijn dat je die – net als de functionele eisen – ophaalt bij de opdrachtgever. Dat dat kennelijk niet voor iedereen voor de hand ligt, blijkt uit een recente uitspraak van een collega-architect: “ja hoor eens, de business snapt niet eens wat een niet-functionele eis is. Dus daar moet je ze helemaal niet naar vragen. Volgens mij moet je dat gewoon zelf een beetje proberen in te schatten.” Nou&#8230; volgens mij niet.)</p>
<p>En natuurlijk hebben we ook meer inzicht nodig in de impact van niet-functionele eisen op BI-architecturen, en in de manier waarop de verschillende alternatieven de gestelde eisen al dan niet kunnen adresseren. Eigenlijk wil je dus bij iedere oplossing (concept, architectuurstijl, methode, techniek) een bijsluiter hebben die aangeeft wat zijn doel is, wat de bijwerkingen zijn, en wat de contra-indicaties zijn. Aan de bedenkers en toepassers van nieuwe oplossingen de uitdaging om hun ervaringen te delen met de BI-community.</p>
<h3>Tussen de oren</h3>
<p>Maar uiteindelijk begint het allemaal bij de mindset: bij het inzicht dat niet alles een spijker is. Hopelijk gaan steeds meer BI-architecten de voordelen inzien van een gereedschapskist die meer bevat dan alleen een hamer.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=101" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/het-architectuurproces-bi-style/feed/</wfw:commentRss>
		</item>
		<item>
		<title>System of facts - maar wat zijn facts?</title>
		<link>http://blog.grey-matter.nl/system-of-facts-maar-wat-zijn-facts/</link>
		<comments>http://blog.grey-matter.nl/system-of-facts-maar-wat-zijn-facts/#comments</comments>
		<pubDate>Thu, 19 Mar 2009 13:02:29 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[architectuur]]></category>

		<category><![CDATA[data-integratie]]></category>

		<category><![CDATA[datawarehousing]]></category>

		<category><![CDATA[Data Vault]]></category>

		<category><![CDATA[functionele benadering]]></category>

		<category><![CDATA[functionele interface]]></category>

		<category><![CDATA[interface]]></category>

		<category><![CDATA[next generation EDW]]></category>

		<category><![CDATA[next generation enterprise datawarehouse]]></category>

		<category><![CDATA[technische benadering]]></category>

		<category><![CDATA[technische interface]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=17</guid>
		<description><![CDATA[In eerdere blogposts en artikelen ben ik uitgebreid ingegaan op de voordelen van next generation enterprise datawarehousing in het algemeen, en van Data Vault als methodiek/enabler voor het next generation EDW in het bijzonder. Next gen EDW is echter geen haarlemmerolie: hoewel het een bepaalde set problemen oplost, introduceert het zelf ook weer nieuwe vraagstukken, [...]]]></description>
			<content:encoded><![CDATA[<p>In eerdere <a href="http://blog.grey-matter.nl/tag/data-vault/">blogposts</a> en <a href="http://www.prudenza.nl/nl/library/">artikelen</a> ben ik uitgebreid ingegaan op de voordelen van next generation enterprise datawarehousing in het algemeen, en van Data Vault als methodiek/enabler voor het next generation EDW in het bijzonder. Next gen EDW is echter geen haarlemmerolie: hoewel het een bepaalde set problemen oplost, introduceert het zelf ook weer nieuwe vraagstukken, die in een traditionele omgeving niet aan de orde zouden zijn.<br />
Eén daarvan is de vraag welke view op het bronsysteem de basis is voor het datawarehouse-datamodel. <span id="more-17"></span></p>
<h3>&#8220;Single version of the truth&#8221; vs &#8220;system of facts&#8221;</h3>
<p>Bij traditionele datawarehouses, waar het centrale datawarehouse (CDW) de single version of the truth representeert, wordt binnenkomende data direct omgevormd naar een (generiek) bedrijfsmodel. Om als bedrijfsmodel te kunnen fungeren, moet het datawarehouse-datamodel op zichzelf staan, en zo min mogelijk bepaald worden door de bron.</p>
<p>Dit in tegenstelling tot het next gen EDW: daar is het CDW een “system of facts”, dat zich in hoge mate richt naar de modellering van de feiten in het bronsysteem.<br />
Maar wat zijn dan die &#8220;feiten&#8221;? De gebeurtenissen in de werkelijkheid? Of de technische events in het systeem?</p>
<h3>Interface vs implementatie</h3>
<p>Dat klinkt als een non-issue: een bronsysteem wordt geacht te registreren wat er in de werkelijkheid gebeurt, dus werkelijkheid en systeem moeten wel 1:1 zijn. Maar wat het systeem naar buiten toe laat zien, hoeft niet overeen te komen met hoe e.e.a. onder de motorkap geregeld wordt.<br />
Neem als voorbeeld een CRM-systeem: als de gebruiker in het systeem een klant laat verhuizen, en daartoe dus zijn straatnaam, huisnummer, postcode, woonplaats en telefoonnummer wijzigt, is dat in zijn beleving één feit: “klant 12345 verhuist van X naar Y”. Het is echter niet ondenkbaar dat het systeem dat ene feit in zijn data access layer implementeert als 5 verschillende databasetransacties. Wat registreren we nu als feit: 1 verhuizing, of 5 updates?<br />
(Andere afwijkingen tussen interface en implementatie die je zoal kunt tegenkomen, zijn bijvoorbeeld slordige modelleringen - denk aan het opslaan van relaties tussen entiteittypen d.m.v. een onvolledige foreign key, zodat de bedoelde occurrence afgeleid moet worden in de applicatielogica - of performance-optimalisaties die de modellering en/of de data-inhoud beïnvloeden.)</p>
<p>Wat moeten we in het CDW vastleggen om het system of facts zuiver te houden? Kiezen we voor een <em>technische</em> of een <em>functionele</em> benadering?</p>
<h3>Technische benadering</h3>
<p>Bij een technische benadering richt je je naar de implementatie, oftewel: naar de systeemgebeurtenissen. Je haalt de data 1:1 uit de brondatabase, en slaat die op in het CDW. Je hanteert dus het technische datamodel als basis voor het CDW-model.</p>
<p>Collega en <a href="http://www.prudenza.nl/nl/library/">co-auteur</a> Ronald Damhof heeft al eens over dit onderwerp <a href="http://prudenza.typepad.com/dwh/2008/10/source-extracti.html">geblogd</a>, en toonde zich daarbij groot voorstander van de technische benadering. Het klinkt ook aantrekkelijk: je weet tenminste zeker dat je altijd alles binnenkrijgt, en nog op het laagste granulaire niveau ook, dus je kunt alle kanten op. Ook prettig: je hoeft je eigen project niet on hold te zetten tot de beheerders van het bronsysteem tijd hebben om een interface voor je te maken – gewoon een image copy trekken of een replicator laten meelopen, en klaar is Kees.</p>
<p>Tenminste, als Kees toevallig een bronsysteem aan het ontsluiten is wat <span style="text-decoration: underline;">alle</span> informatie-inhoud in zijn data vastlegt. Want bij systemen waarvan interface en implementatie uit elkaar lopen, boet de data aan betekenis in als deze niet door de bril van de applicatielogica bekeken wordt. Wat je in dat geval binnenhaalt is geen granular data, het is less-than-granular: meer data, minder informatie-inhoud.<br />
Er is dan ook geen sprake van dat je bij een technische benadering <a href="http://prudenza.typepad.com/dwh/2008/10/source-extracti.html">“no source-related programming”</a> nodig hebt. René Veldwijk <a href="http://onlinearchief.e-village.nl/article.php?vartid=110235">zei</a> &#8216;t al: &#8220;technische trucs lossen geen logische problemen op&#8221;. Je ontkomt er niet aan om in het EDW - in de Big T, om precies te zijn - de ontbrekende applicatielogica alsnog op de data los te laten: niet eens om “extra” informatie te creëren, maar om überhaupt de informatiewaarde van de binnengehaalde data te reconstrueren. (En dan heb je toch weer die bronbeheerders nodig om je te vertellen hoe de data geïnterpreteerd moet worden.)</p>
<h3>Functionele benadering</h3>
<p>Bij een functionele benadering baseer je je op de interface van het systeem, ofwel: de gebeurtenissen in de werkelijkheid. Het conceptuele datamodel van de bron is dus het uitgangspunt voor het CDW-model. In de interfacing wordt eerst de real-world feiten gereconstrueerd vanuit de implementatie, door er de bijbehorende applicatielogica op los te laten; pas na die vertaalslag worden ze doorgesluisd naar het EDW. </p>
<p>Het EDW wordt daarmee bevrijd van een stuk complexiteit waar het sowieso niet de beste papieren voor had; en de Big T, van nature al geen lichtgewicht, wordt qua processing en beheerbaarheid in ieder geval niet extra belast.<br />
Bovendien zal het weinig betoog behoeven dat een functioneel georiënteerd model een stuk robuuster c.q. veranderbestendiger is dan een technisch georiënteerde variant. De functionele benadering sluit aan bij diverse principes van goede software-architectuur, zoals information hiding en loose coupling. </p>
<h3>En verder?</h3>
<p>Zelf heb ik een sterke voorkeur voor de functionele benadering, maar misschien zijn er goede redenen om toch te kiezen voor de technische benadering. Ik ben zeer geïnteresseerd in de afwegingen die daarbij een rol spelen.<br />
Ook zegt het bovenstaande nog niets over hoe de doelstellingen van het next gen EDW het beste gerealiseerd worden – is bijvoorbeeld traceerbaarheid beter gediend met een functionele of een technische benadering?</p>
<p>Ik ben benieuwd naar jullie mening over dit onderwerp.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=17" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/system-of-facts-maar-wat-zijn-facts/feed/</wfw:commentRss>
		</item>
		<item>
		<title>BI: to ROI or not to ROI</title>
		<link>http://blog.grey-matter.nl/bi-to-roi-or-not-to-roi/</link>
		<comments>http://blog.grey-matter.nl/bi-to-roi-or-not-to-roi/#comments</comments>
		<pubDate>Thu, 05 Mar 2009 12:03:24 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[business intelligence]]></category>

		<category><![CDATA[onderzoek]]></category>

		<category><![CDATA[ROI]]></category>

		<category><![CDATA[toegevoegde waarde]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=16</guid>
		<description><![CDATA[In BI-land woedt, naar aanleiding van een onderzoek van Passionned, al een paar weken een debat over het al dan niet ontbreken van ROI van business intelligence. Daarbij zijn al veel goede argumenten de revue gepasseerd, maar  met name de bijdrage van Laurent Koelink, deze week op de Computable-site, was me uit het hart [...]]]></description>
			<content:encoded><![CDATA[<p>In BI-land woedt, naar aanleiding van een onderzoek van Passionned, al een paar weken een debat over het <a href="http://www.computable.nl/artikel/ict_topics/business_intelligence/2844877/1277145/bi-betaalt-zich-bijna-nooit-terug.html">al</a> dan <a href="http://www.computable.nl/artikel/ict_topics/business_intelligence/2855937/1277145/boze-experts-bi-verdient-zich-wl-terug.html">niet</a> ontbreken van ROI van business intelligence. Daarbij zijn al veel goede argumenten de revue gepasseerd, maar <span id="more-16"></span> met name <a href="http://www.computable.nl/artikel/ict_topics/business_intelligence/2886245/1277145/inzicht-was-nog-nooit-zo-belangrijk.html">de bijdrage van Laurent Koelink, deze week op de Computable-site</a>, was me uit het hart gegrepen.</p>
<p>Om te beginnen pleit hij ervoor om het debat vanuit een positieve insteek te voeren. Juist nu we middenin een crisis zitten, is niemand gebaat bij een negatieve beeldvorming omtrent BI. Het leidt er alleen maar toe dat bedrijven de strategische voordelen van een excellente informatievoorziening mislopen, omdat ze BI afserveren als een dure hobby van IT die toch niets concreets gaat bijdragen. Zonde, en nergens voor nodig.</p>
<h3>Waar zouden we zijn zonder&#8230;?</h3>
<p>Verder zet hij scherp neer waarom de hele discussie eigenlijk een verkeerd uitgangspunt heeft: als uit onderzoek blijkt dat 33% van de topbestuurders twijfelt of zijn of haar bedrijf wel de juiste keuzes kan maken in het bestrijden van de gevolgen van de economische crisis, hoe kun je dan ooit onderbouwen dat BI voor hen geen toegevoegde waarde zou hebben?</p>
<p>Ik heb niet veel met de eeuwig terugkerende vraag naar de ultieme definitie van BI, maar als ik er een moet kiezen, dan die van <a href="http://www.computable.nl/artikel/ict_topics/business_intelligence/2492928/1277145/de-definitie-van-bi-bestaat-lees-maar.html">Andries Bottema</a>: <em>“het inzetten van informatie als productiemiddel”</em>. Zo bekeken, is het onzin om te stellen dat BI zich niet terugbetaalt. Het zou een no-brainer moeten zijn dat je niets kunt bereiken zonder informatie: hoe wil je anders je organisatie sturen? Hoe wil je operational excellence of customer intimacy bereiken zonder informatie?</p>
<p>De vraag of BI zich wel terugbetaalt, kan wat mij betreft dan ook met een wedervraag beantwoord worden: <em>kan een organisatie eigenlijk wel zonder?</em></p>
<h3>Ruimte voor verbetering</h3>
<p>Dat vaststellen, is één – er handen en voeten aan geven is een tweede. Een valide vervolgvraag is dan “betalen concrete BI-implementaties zich altijd terug?” Daarmee opent zich een heel andere discussie. (De vraag of ROI eigenlijk wel altijd gemeten kan worden, en of BI nog andere voordelen heeft dan alleen financiële, laat ik maar even buiten beschouwing. Evenals de vraag of de gekozen onderzoeksopzet wel voldoende basis biedt voor het trekken van zulke stellige conclusies.)</p>
<p>Feit is dat BI-implementaties nog steeds niet altijd opleveren wat ervan verwacht werd. Deels komt dat doordat BI-projecten niet alleen maar een ICT-kant hebben, maar, zoals Daan van Beek in een latere nuancering <a href="http://www.computable.nl/artikel/ict_topics/business_intelligence/2869004/1277145/biexperts-moeten-de-feiten-niet-ontkennen.html">zegt</a>, “een mengeling van gedrag, managementmodellen en technologie [zijn], waarbij de kritische succesfactoren niet aan de technische, maar vooral aan de gedragskant liggen”.<br />
Maar wat de oorzaken ook zijn, er is ruimte voor verbetering: we zouden veel waarde voor onze klanten kunnen toevoegen, maar kennelijk realiseren we die niet altijd. Waarom niet, en hoe kan het beter?</p>
<p>Dat lijkt me een mooi onderwerp voor vervolgonderzoek. </p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=16" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/bi-to-roi-or-not-to-roi/feed/</wfw:commentRss>
		</item>
		<item>
		<title>De rol van het datamodel in het datawarehouse</title>
		<link>http://blog.grey-matter.nl/de-rol-van-het-datamodel-in-het-datawarehouse/</link>
		<comments>http://blog.grey-matter.nl/de-rol-van-het-datamodel-in-het-datawarehouse/#comments</comments>
		<pubDate>Sun, 28 Sep 2008 17:51:17 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[datamodelleren]]></category>

		<category><![CDATA[datawarehousing]]></category>

		<category><![CDATA[Data Vault]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=15</guid>
		<description><![CDATA[In juni van dit jaar publiceerde DB/M een artikel van Karien Verhagen en Bart Vrijkorte, waarin Data Vault als techniek voor het modelleren van centrale datawarehouses wordt vergeleken met &#8220;relationele&#8221; (bedoeld wordt: 3NF) modellering. Naast voordelen benoemen de auteurs ook enkele bezwaren van de methodiek.
De opgeworpen bezwaren snijden echter naar mijn mening geen hout in [...]]]></description>
			<content:encoded><![CDATA[<p>In juni van dit jaar publiceerde DB/M een artikel van Karien Verhagen en Bart Vrijkorte, waarin Data Vault als techniek voor het modelleren van centrale datawarehouses wordt vergeleken met &#8220;relationele&#8221; (bedoeld wordt: 3NF) modellering. Naast voordelen benoemen de auteurs ook enkele bezwaren van de methodiek.</p>
<p>De opgeworpen bezwaren snijden echter naar mijn mening geen hout in een datawarehouse-context. Om een modellering voor datawarehouses te beoordelen, zul je daar op z&#8217;n minst met een datawarehouse-bril naar moeten kijken. Dat lijkt een open deur, maar in dit geval lijken de auteurs eerder een OLTP-bril op te hebben. Het resultaat is een vertekend beeld van de sterktes en zwaktes van Data Vault.<span id="more-15"></span></p>
<h3>Datawarehouse != OLTP</h3>
<p>Het datamodel van een datawarehouse heeft een totaal andere rol dan dat van een OLTP-systeem.<br />
Een datawarehouse doet niets anders dan elders gecreëerde gegevens ontvangen, opslaan en weer afstaan – en dat in grote hoeveelheden. Daarbij speelt verwerkingssnelheid een belangrijke rol, want de totale verwerking moet meestal binnen een beperkt batchwindow plaatsvinden. Verder weten we inmiddels dat het ETL-proces 70% van de totale ontwikkel- en onderhoudsinspanning en -kosten in beslag neemt; hoe beheer(s)baarder het proces is, hoe meer dat scheelt in de kosten.</p>
<p>Deze factoren bepalen de inrichting van het datawarehouseproces. Dat vertaalt zich in uitgangspunten als:</p>
<ul>
<li>liever vele simpele, gestandaardiseerde ETL-procedures dan een klein(er) aantal complexere, customized procedures</li>
<li>inserts hebben de voorkeur boven updates</li>
<li>eventuele datakwaliteitscontroles op de invoer doe je niet met database constraints, maar in het ETL-proces (aangezien dat meestal beter performt)</li>
<li>zo min mogelijk onderlinge afhankelijkheden tussen laadprocedures: enerzijds om het proces overzichtelijk en onderhoudbaar te houden; anderzijds om maximaal te kunnen parallelliseren, wat bijdraagt aan de schaalbaarheid van het proces</li>
</ul>
<p>Het datawarehouse-model is sterk bepalend voor de mate waarin deze uitgangspunten gerealiseerd kunnen worden. (Data Vault is speciaal ontworpen om maximale ondersteuning te bieden). Niets in het artikel wijst er echter op dat de auteurs deze rol van het datamodel hebben laten meewegen in hun beoordeling.</p>
<p>Laten we eens enkele van hun bezwaren onder de loep nemen.</p>
<h3>Geen constraints</h3>
<p>Verhagen en Vrijkorte zien het als een risico dat Data Vault relaties tussen entiteiten altijd weggeneraliseert naar n:m-cardinaliteit: daarmee valt immers de controle in de database op invoer van de juiste cardinaliteit weg.</p>
<p>Zoals gezegd: als je die controle al wilt uitoefenen, dan doe je dat in je ETL-proces, niet in de database (in tegenstelling tot wat de auteurs suggereren, is dat geen Data Vault-bedenksel, maar een geaccepteerde best practice in datawarehouseland).<br />
De Data Vault-filosofie gaat echter nog verder: het centrale datawarehouse wordt beschouwd als een system of fact, dat *alle* aangeleverde gegevens moet kunnen verwerken – het oordeel “deugdelijk of niet” wordt pas onderweg naar de datamart geveld, op basis van de criteria van de eindgebruiker. Aan de poort worden dus überhaupt geen controles uitgevoerd (behalve om gegevens uit te filteren waar het systeem technisch niet mee uit de voeten kan, bijv. vanwege verkeerde gegevensformaten).<br />
Een Data Vault-model moet dus kunnen omgaan met gegevens die eigenlijk een verkeerde cardinaliteit hebben. En dan is het juist heel verstandig – zo niet noodzakelijk – om a) zo min mogelijk constraints in het model op te nemen, en b) deze daar waar ze onvermijdelijk zijn zo ruim mogelijk te definiëren. Het gebruik van linktabellen, waardoor iedere relatie per definitie de ruimste cardinaliteit krijgt, is dan de meest logische maatregel.</p>
<h3>Linktabellen vs foreign keys</h3>
<p>Verder stellen Verhagen en Vrijkorte dat in sommige situaties<sup class='footnote'><a href='#fn-15-1' id='fnref-15-1'>1</a></sup> het gebruik van een linktabel “weinig toegevoegde waarde lijkt te hebben” (waarom dat zo zou zijn, wordt niet nader onderbouwd), en zijn van mening dat het “het beste lijkt” om maar gewoon een foreign key te gebruiken.</p>
<p>Ook nu wordt niet de impact meegewogen die modelkeuzes hebben op het ETL-proces. De meerwaarde van de linktabel zit hem nl. in de modelmatige ontkoppeling van de hubs, en daarmee van de bijbehorende laadprocedures. Hierdoor wordt het aantal synchronization points in het proces geminimaliseerd: eerst worden alle hubs parallel geladen, daarna alle links parallel, daarna alle satellites parallel. (Als er voldoende processing power voorhanden is, is het zelfs mogelijk om de hub-satellites gelijktijdig met de links te laden.)<br />
Doordat de onderlinge wachttijd tussen jobs minimaal is, worden het batchwindow en de beschikbare resources optimaal benut; dit komt de schaalbaarheid van het proces ten goede.<br />
Verder is het voor ontwikkeling en onderhoud van ETL-processen een voordeel als laadprocedures zo min mogelijk onderling afhankelijk zijn: de processen worden er flexibeler en minder complex van.</p>
<p>Door de hubs aan elkaar te knopen via foreign keys loop je al die voordelen mis, omdat de hubs nu noodgedwongen serieel moeten worden geladen. Het beslag op het batchwindow wordt daarmee groter dan nodig, en de schaalbaarheid van het proces loopt eveneens terug. Bovendien maakt de onderlinge afhankelijkheid het ETL-proces complexer, en dus slechter onderhoudbaar.</p>
<h3>End user access?</h3>
<p>Tenslotte noemen de auteurs nog als bezwaar dat Data Vault-modellen lastig bevraagbaar zijn door eindgebruikers. De observatie klopt - maar is het ook een probleem? De modellering is specifiek bedoeld voor het centrale datawarehouse, en daar heeft de eindgebruiker sowieso niets te zoeken. Is het een nadeel als in een restaurant de keuken niet even sfeervol is ingericht als de eetzaal?</p>
<h3>Conclusie</h3>
<p>Data Vault heeft zijn sterke en zwakke kanten; omdat het concept nog maar net in opkomst is, zijn met name over de zwaktes nog weinig ervaringsfeiten voorhanden.<br />
Bij afwezigheid daarvan, kan discussie een uitstekend middel zijn om onze beeldvorming aan te scherpen - maar dan moeten we die wel voeren met geldige argumenten.</p>
<p><br/><br/></p>
<div class='footnotes'>
<div class='footnotedivider'></div>
<ol>
<li id='fn-15-1'>de auteurs doelen hier op zgn. “zwakke entiteiten”: entiteiten die (deels) gedefinieerd c.q. geïdentificeerd worden door hun relatie met een andere entiteit, waardoor die relatie de facto onveranderlijk is. Een voorbeeld is de relatie van een factuurregel met de factuur waarop hij voorkomt. <span class='footnotereverse'><a href='#fnref-15-1'>&#8617;</a></span></li>
</ol>
</div>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=15" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/de-rol-van-het-datamodel-in-het-datawarehouse/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Data Vault en brononafhankelijkheid</title>
		<link>http://blog.grey-matter.nl/data-vault-en-brononafhankelijkheid/</link>
		<comments>http://blog.grey-matter.nl/data-vault-en-brononafhankelijkheid/#comments</comments>
		<pubDate>Tue, 10 Jun 2008 07:41:07 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[architectuur]]></category>

		<category><![CDATA[datawarehousing]]></category>

		<category><![CDATA[Data Vault]]></category>

		<category><![CDATA[datamodel]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=14</guid>
		<description><![CDATA[De Data Vault-methodiek betekent in een aantal opzichten een radicale breuk met het datawarehouse-verleden. Hoe radicaal, merk je pas goed als je de ideeën eruit begint toe te passen. Dan kom je er ook achter dat je alleen ten volle profijt kunt trekken van dat nieuwe denken, als je je oude ideeën, aannamen en ervaring [...]]]></description>
			<content:encoded><![CDATA[<p>De Data Vault-methodiek betekent in een aantal opzichten een <a href="http://blog.grey-matter.nl/2008/04/data-vault-meer-dan-modellering/">radicale breuk</a> met het datawarehouse-verleden. Hoe radicaal, merk je pas goed als je de ideeën eruit begint toe te passen. Dan kom je er ook achter dat je alleen ten volle profijt kunt trekken van dat nieuwe denken, als je je oude ideeën, aannamen en ervaring overboord durft te zetten.<br />
Zo kan een vertrouwd concept als brononafhankelijkheid door een frisse benadering een geheel andere invulling krijgen.<br />
<span id="more-14"></span></p>
<h3>Brononafhankelijkheid</h3>
<p>Een datawarehouse moet (zo) brononafhankelijk (mogelijk) zijn: wijzigingen in de bronsystemen moeten zoveel mogelijk worden losgekoppeld van wijzigingen in de BI-omgeving.<br />
Traditioneel wordt het datamodel van het centrale datawarehouse beschouwd als een belangrijke enabler voor brononafhankelijkheid. Het is een best practice om dit model niet te baseren op de datamodellen van de bronnen, maar op bedrijfsmodellen: informatiemodellen die de kern van het bedrijfsproces weten te vangen, ongeacht hoe dat proces op enig moment geïmplementeerd is. Daardoor wordt het datawarehouse-model in zekere mate generiek: er wordt als het ware op voorhand al rekening gehouden met toekomstige wijzigingen in de bron, zodat die geen aanpassing van het datamodel vereisen. Aanpassing van het ETL-proces is echter niet te vermijden, de brongegevens moeten immers omgevormd worden naar het generieke model.</p>
<h3>Omslag</h3>
<p>De Data Vault-aanpak staat daar haaks op. Er wordt geen poging gedaan om achterliggende bedrijfsprincipes te achterhalen en de feiten daar naartoe te modelleren: de feiten worden vastgelegd zoals ze binnenkomen. Op basis van een set vuistregels wordt een Data Vault-variant van het bronmodel geconstrueerd (en ook de ETL daar naartoe kan op die manier bepaald worden), maar inhoudelijk wordt er niets gewijzigd aan de gemodelleerde begrippen.<br />
Met andere woorden: een Data Vault wordt volledig bronafhankelijk gemodelleerd!</p>
<p>Dat druist lijnrecht in tegen alles wat we weten over datawarehousing. In mijn huidige opdracht ben ik heel lang bezig geweest om die brongestuurde modellering te verenigen met het idee van een generiek datawarehouse-datamodel – we willen toch brononafhankelijkheid? Nou dan!<br />
Totdat ik me realiseerde dat het in de Data Vault-architectuur zinloos is (zo niet contraproductief) om het centraal datawarehouse generiek te modelleren, omdat het in de overall omgeving een totaal andere rol speelt dan bij de traditionele aanpak.</p>
<h3>Een andere kijk op het datawarehouse</h3>
<p>We zijn gewend het centrale datawarehouse te beschouwen als de kern van de totale datawarehouse-omgeving, dé plek waar het allemaal gebeurt. Binnenkomende brongegevens worden onderweg naar het centrale datawarehouse omgemodelleerd, losgekoppeld van de bron, geïntegreerd, geschoond, etc. Het zwaartepunt van de processing, de <a href="http://prudenza.typepad.com/dwh/2008/06/the-big-t.html">“Big T”</a> (als in: Transformatie met een grote T) bevindt zich dus aan de ingang van het datawarehouse.</p>
<p>In de Data Vault-architectuur daarentegen, speelt het centrale datawarehouse eigenlijk maar een ondergeschikte rol. De Big T, die in deze architectuur tussen het datawarehouse en de datamarts is gepositioneerd, is de kern van een Data Vault-datawarehouse: daar voeren we alle business logica uit, daar integreren we, daar schonen we.<br />
En daar ligt ook het ontkoppelpunt met de bronnen. Als de bronnen wijzigen, moeten de gewijzigde gegevens nog steeds probleemloos ingelezen kunnen worden in het datawarehouse; maar wat er daarna mee gebeurt, wordt volledig bepaald in de Big T. Geheel in lijn met de Data Vault-principes, worden ook de gewijzigde gegevens niet zonder meer automatisch doorgeladen naar de datamart, maar alleen als de gebruiker daarom vraagt.</p>
<h3>Impact</h3>
<p>Maar als het ontkoppelpunt tussen bronnen en BI-omgeving binnen het datawarehouse komt te liggen, hebben bronwijzigingen toch wel degelijk impact op het datawarehouse-model?<br />
Jawel – maar hoe erg is dat eigenlijk? Laten we eens bekijken hoe een en ander in de praktijk uitpakt.</p>
<p>Om de gewijzigde brongegevens in te passen in het datawarehouse-model, halen we ze door de modelleringsregels van de Data Vault: we zetten ze rechtstreeks om naar corresponderende hubs, satellites of links. (Een bronaanpassing zul je in een Data Vault vaak terugzien als nieuwe attributen in een bestaande satellite, of als nieuwe links en satellites die worden toegevoegd tussen de bestaande structuren.) Daardoor kan ook de ETL-verwerking het datawarehouse in rechttoe-rechtaan zijn; de gegevens kunnen vrijwel 1:1 geladen worden. (Dit deel van de ETL kan zelfs gegenereerd worden.)<br />
De Big T, het meest complexe proces, hoeven we pas aan te passen als de gebruikers de gegevens in de BI-omgeving willen zien. Die klus doen we in ons eigen tempo, los van de bronwijziging.</p>
<p>Ook in een traditionele omgeving moet het ETL-proces aangepast worden. Maar daar wordt de zwaarste verwerking al aan de ingang van het datawarehouse gedaan: willen we dus de nieuwe gegevens überhaupt kunnen laden, dan hebben we geen andere keus dan direct de Big T onder handen te nemen – ook als we de nieuwe gegevens nog niet naar de datamarts hoeven door te zetten. En voor het uitvoeren van die complexe aanpassing, hebben we dan ook nog de releasedatum van het bronsysteem als deadline – want zodra de nieuwe interface operationeel wordt, moet het datawarehouse deze netjes kunnen verwerken, anders loopt het ETL-proces stuk.</p>
<p>Oftewel: in een Data Vault moet het datawarehouse-model weliswaar aangepast worden, maar de totale impact op de datawarehouse-omgeving is een stuk beter te beheren en beheersen. En dat is toch uiteindelijk de reden waarom we brononafhankelijkheid nastreven.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=14" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/data-vault-en-brononafhankelijkheid/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Ongestructureerde gegevens: zin of onzin?</title>
		<link>http://blog.grey-matter.nl/ongestructureerde-gegevens-zin-of-onzin/</link>
		<comments>http://blog.grey-matter.nl/ongestructureerde-gegevens-zin-of-onzin/#comments</comments>
		<pubDate>Mon, 26 May 2008 19:21:44 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[business intelligence]]></category>

		<category><![CDATA[DW 2.0]]></category>

		<category><![CDATA[ongestructureerde gegevens]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=13</guid>
		<description><![CDATA[Ongestructureerde gegevens in de informationele omgeving zijn helemaal hip. DB/M wijdde er in maart van dit jaar een themanummer aan, Bill Inmon ruimt er een prominente plaats voor in in zijn DW 2.0, IBM timmert aan de weg met het UIMA-framework , en inmiddels zijn er diverse commerciële producten beschikbaar die zich hierop richten.
Hip of [...]]]></description>
			<content:encoded><![CDATA[<p>Ongestructureerde gegevens in de informationele omgeving zijn helemaal hip. DB/M wijdde er in maart van dit jaar een themanummer aan, Bill Inmon ruimt er een prominente plaats voor in in zijn DW 2.0, IBM timmert aan de weg met het <a href='http://domino.research.ibm.com/comm/research_projects.nsf/pages/uima.index.html'>UIMA-framework</a> , en inmiddels zijn er diverse commerciële producten beschikbaar die zich hierop richten.<span id="more-13"></span><br />
Hip of niet, ik zie nog wel wat haken en ogen. Al was het alleen maar dat alle airplay eromheen voornamelijk over de technologiekant gaat, dus over het “hoe”. Het “waarom” komt nog onvoldoende uit de verf.</p>
<h3>Must have?</h3>
<p>Zo stelt Erwin Vorwerk in het DB/M-themanummer dat volgens analisten meer dan 80% van alle beschikbare data in de categorie “ongestructureerd” valt: “[...] steeds meer directies realiseren zich dat hun Business Intelligence zich beperkt tot slechts 20 procent van de binnen een onderneming aanwezige data en dat men dus op basis van een beperkte blik beslissingen neemt. Daarmee neemt de vraag naar geïntegreerde data toe.”<br />
Leidt ontsluiting van slechts 20% van alle data automatisch tot een beperkte blik? Anders gezegd: leidt 100% gegevensontsluiting automatisch tot betere besluitvorming? Ook als de percentages kloppen (hoe zijn die eigenlijk bepaald? Welke grootheden zijn er met elkaar vergeleken? aantallen bytes? aantallen records versus aantallen documenten?), zeggen ze op zichzelf nog niets: meer is niet altijd beter. Veel belangrijker is de kwaliteit en het relatieve belang van de gegevens, en daarmee de waarde die ze toevoegen aan de BI-omgeving.<br />
Gestructureerde data ontsluiten we niet zomaar voor de heb, dat doen we alleen als we denken dat we er een concrete informatiebehoefte mee denken te vervullen, nu of in de toekomst. Voor ongestructureerde data zou hetzelfde moeten gelden - welk percentage van het totaal ze uitmaken, is daarbij niet relevant.</p>
<h3>First things first</h3>
<p>Daarmee wil ik overigens niet zeggen dat ongestructureerde informatie per definitie nutteloos is voor informationele doeleinden - hoewel ik er nog geen requirement voor ben tegengekomen, kan ik me voorstellen dat die er wel degelijk kan zijn. Maar ik vraag me af of we niet te veel tegelijk willen: de meeste organisaties hebben immers nog hun handen vol aan het leggen van een solide informationele basis met gestructureerde data (en lopen daarbij tegen de nodige moeilijkheden op). Zelfs de organisaties die op dat gebied voorop lopen, zijn nog maar net begonnen met het uitnutten van hun BI-omgeving. Want hij mag dan “maar” 20% van de totale gegevensverzameling omvatten, het is wel een goudmijn aan onontdekte informatie. Eentje die zich bij uitstek leent om er advanced analytics op los te laten, om maar iets te noemen.</p>
<p>Zijn we wel aan nieuwe avonturen met ongestructureerde data toe? Het is al een uitdaging op zich om het maximale uit de reguliere BI-omgeving te halen - ook zonder ongestructureerde gegevens valt daar voorlopig nog voldoende return on investment te oogsten.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=13" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/ongestructureerde-gegevens-zin-of-onzin/feed/</wfw:commentRss>
		</item>
		<item>
		<title>4 misverstanden omtrent de single version of the truth</title>
		<link>http://blog.grey-matter.nl/4-misverstanden-omtrent-de-single-version-of-the-truth/</link>
		<comments>http://blog.grey-matter.nl/4-misverstanden-omtrent-de-single-version-of-the-truth/#comments</comments>
		<pubDate>Tue, 13 May 2008 13:53:16 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[business intelligence]]></category>

		<category><![CDATA[versions of the truth]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=9</guid>
		<description><![CDATA[Het begrip &#8220;single version of the truth&#8221; heeft zo langzamerhand een bijna onaantastbare status gekregen; van een mogelijke oplossing voor een communicatieprobleem is het uitgegroeid tot een doelstelling in zichzelf. Is dat eigenlijk wel terecht? 4 misverstanden over de single version of the truth op een rijtje.

#1: &#8220;Zonder single version of the truth loopt alles [...]]]></description>
			<content:encoded><![CDATA[<p>Het begrip &#8220;single version of the truth&#8221; heeft zo langzamerhand een bijna onaantastbare status gekregen; van een mogelijke oplossing voor een communicatieprobleem is het uitgegroeid tot een doelstelling in zichzelf. Is dat eigenlijk wel terecht? 4 misverstanden over de single version of the truth op een rijtje.</p>
<p><span id="more-9"></span></p>
<h3>#1: &#8220;Zonder single version of the truth loopt alles in de soep&#8221;</h3>
<p>Alles? Welnee. De salesmanager noemt iedereen aan wie hij ooit offerte heeft uitgebracht, een klant; de onderhoudsafdeling beschouwt alleen bedrijven met een supportcontract als klant, en de administrateur heeft het over klanten als hij eigenlijk debiteuren bedoelt. Allemaal kunnen ze prima hun werk doen, ondanks de mismatch tussen hun klantbegrippen.<br />
Het wordt pas lastig als ze met elkaar in gesprek moeten over hun klanten: de communicatie tussen twee partijen wordt bemoeilijkt als beide een ander begrippenkader hanteren.</p>
<p>Toch hoeft het ontbreken van een gemeenschappelijk kader geen onoverkomelijk probleem te zijn. In informationeel opzicht hebben we wel vaker te maken met multiple versions of the truth die vreedzaam naast elkaar bestaan. Zo zijn boekhouding en datawarehouse meestal niet exact met elkaar in overeenstemming; maar in de praktijk is dat nauwelijks een probleem, omdat we (als het goed is) weten wat de verschillen zijn en hoe ze veroorzaakt worden.<br />
De aanwezigheid van meerdere versies van de waarheid hoeft dus op zich geen problemen te geven. Zolang we in staat zijn om alle verschillende versies van de waarheid te onderhouden, ze nauwkeurig te definiëren, en het verschil tussen twee versies te herleiden en te verklaren, is er niets aan de hand. Pas als niet duidelijk is wat de verschillende versies precies betekenen, hoe ze afgeleid zijn, en hoe ze van elkaar verschillen, is er reden tot zorg.</p>
<h3>#2: &#8220;Als we alles in het datawarehouse zetten, hebben we een single version of the truth&#8221;</h3>
<p>De term &#8220;single version of the truth&#8221; wordt vaak vertaald naar een notie van een soort BI-universum: een informationele omgeving (meestal op basis van een datawarehouse) waarin alle mogelijke en bekende interpretaties van de bedrijfsbegrippen worden ondergebracht, allemaal met een heldere definitie en onder een eigen, unieke benaming. Daardoor is voor alle gebruikers van de omgeving duidelijk welke begrippen er in omloop zijn; wat ze precies betekenen; en op welke begrippen een bepaalde rapportage betrekking heeft.<br />
Zoveel duidelijkheid in een informationele omgeving is al een hele stap in de goede richting - maar mogen we ook echt spreken van een single version of the truth?</p>
<p>Laten we als voorbeeld een BI-omgeving voor een winkelorganisatie in gedachten nemen. In de organisatie worden zo&#8217;n 14 verschillende definities voor het begrip &#8220;omzet&#8221; gehanteerd, allemaal met een net iets andere afleiding.<br />
In lijn met de hierboven beschreven &#8220;BI-universum&#8221;-aanpak analyseren we wat ieder begrip betekent en hoe het afgeleid wordt; vervolgens geven we er een unieke, onderscheidende benaming aan: klantomzet, weekomzet, actieomzet, enzovoort. We kunnen nu alle omzetbegrippen naast elkaar beschikbaar maken in onze fictieve BI-omgeving.<br />
So far so good. Maar zijn we nu ook iets opgeschoten als het gaat om onderlinge verstaanbaarheid en vergelijkbaarheid? &#8220;Hoera, de omzet per klant is met 20% gestegen! &#8221; &#8220;Nee, het gaat hartstikke slecht, want de weekomzet is met 10% gedaald!&#8221;. Mars en Venus in de BI-omgeving: iedereen richt zich nog steeds naar zijn eigen setje begrippen, zijn eigen waarheid. Om echt te kunnen spreken van één versie van de waarheid, is meer nodig dan het hernoemen en samenvoegen van alle begrippen tot één grote verzameling definities.<br />
En daarmee hebben we het derde misverstand te pakken:</p>
<h3>#3: &#8220;Het creëren van een single version of the truth is een IT-probleem&#8221;</h3>
<p>Veel datawarehouseprojecten krijgen bij aanvang de inrichting van een single version of the truth mee als doelstelling. De BI-afdeling is echter niet de juiste partij om dit probleem aan te pakken. Zolang iedereen zijn eigen stukje van de verzameling blijft gebruiken, is er van één versie van de waarheid geen sprake, hoe veelomvattend je de verzameling ook maakt. De enigen die daar verandering in kunnen brengen, zijn de gebruikers van de definities zelf. De BI-afdeling kan geen unanieme adoptie van werkelijk gemeenschappelijke definities afdwingen; het creëren van een single version of the truth is daarmee in de kern een businessvraagstuk. Zolang onze gebruikers het onderling niet eens zijn over hun gezamenlijke definities, kunnen wij niet meer doen dan al hun waarheden ondersteunen.</p>
<h3>#4: &#8220;Zonder single version of the truth zullen we elkaar nooit begrijpen&#8221;</h3>
<p>Als het op onderlinge verstaanbaarheid en vergelijkbaarheid aankomt, zijn gebruikers meer gebaat bij een &#8220;common version of the truth&#8221; dan bij een single version. Het is niet nodig om alle definities te vervangen door die ene canonieke set waar iedereen mee door de bocht kan - als zoiets al haalbaar zou zijn. Het doel wordt al bereikt als men tot overeenstemming weet te komen over een verzameling van standaarddefinities die gehanteerd kan worden voor alle afdelingsoverstijgende en bedrijfsbrede rapportages. Op afdelingslokaal niveau kan iedereen dan gewoon als vanouds zijn eigen versie van de waarheid blijven hanteren; de &#8220;common version of the truth&#8221; wordt dus één van de vele ondersteunde waarheden.</p>
<p>Implementatie van een single version of the truth is niet de enige manier om de informatiebehoeften van onze gebruikers optimaal te ondersteunen, en al helemaal niet de enige juiste. Hoog tijd dus om het begrip zijn mythologische status te ontnemen.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=9" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/4-misverstanden-omtrent-de-single-version-of-the-truth/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Actuele informatie: niet zo simpel als het lijkt</title>
		<link>http://blog.grey-matter.nl/actuele-informatie-niet-zo-simpel-als-het-lijkt/</link>
		<comments>http://blog.grey-matter.nl/actuele-informatie-niet-zo-simpel-als-het-lijkt/#comments</comments>
		<pubDate>Fri, 02 May 2008 09:08:40 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[business intelligence]]></category>

		<category><![CDATA[real-time]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=10</guid>
		<description><![CDATA[&#8220;90 procent van CIO’s mist real-time bedrijfsinformatie&#8221;, kopte Computable eerder deze week. Uit onderzoek van Progress Software blijkt dat &#8220;vrijwel alle ict-verantwoordelijken klagen over het gebrek aan actuele bedrijfskritische informatie&#8221;.  Bedrijven “[...] kunnen hierdoor niet snel genoeg reageren op veranderende marktomstandigheden of regelgeving, zodat ze groeikansen missen.” De uitkomsten van het onderzoek laten op [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.computable.nl/artikel/ict_topics/business_intelligence/2536590/1277145/90-procent-van-cios-mist-realtime-bedrijfsinformatie.html">&#8220;90 procent van CIO’s mist real-time bedrijfsinformatie&#8221;</a>, kopte Computable eerder deze week. Uit onderzoek van Progress Software blijkt dat &#8220;vrijwel alle ict-verantwoordelijken klagen over het gebrek aan actuele bedrijfskritische informatie&#8221;.  Bedrijven “[...] kunnen hierdoor niet snel genoeg reageren op veranderende marktomstandigheden of regelgeving, zodat ze groeikansen missen.” De uitkomsten van het onderzoek laten op een aantal punten onduidelijkheden bestaan.<br />
<span id="more-10"></span></p>
<h3>Real-time - really?</h3>
<p>Zo vraag ik me af of het belang van “real-time” informatielevering in de praktijk wel zo groot is als het kennelijk gevoeld wordt door de ondervraagden. Dat gegevens op het juiste moment beschikbaar moeten zijn, spreekt vanzelf; maar “actueel” en &#8220;just-in-time&#8221; is niet hetzelfde als &#8220;real-time&#8221;.<br />
Real-time informatie is noodzakelijk als er op de (zeer) korte termijn beslist en gehandeld moet worden. Als een vrachtwagen na een uur wachten bij het magazijn nog steeds niet gelost is, dan moet de juiste persoon gealarmeerd worden, zodat die direct actie kan ondernemen. In zo&#8217;n geval heb je niets aan een rapportje wat dagelijks om 9 uur ververst wordt.<br />
Daarentegen heeft het type informatie waar in het artikel sprake van is, nl. marktontwikkelingen en veranderende regelgeving, in het algemeen een langere invloedshorizon; we spreken dan eerder in termen van dagen, weken, zo niet maanden. Als uit onderzoek blijkt dat de consument het laatste halfjaar steeds vaker en gemakkelijker van telefoonaanbieder wisselt, dan wil je daar als provider natuurlijk op inspelen – maar maakt het daarbij verschil of die informatie vandaag, morgen of na het weekend op het juiste bureau terechtkomt? Het is moeilijk voor te stellen hoe real-time informatievoorziening daarin een cruciale voorsprong zou kunnen geven.</p>
<h3>Verbeteren - maar hoe?</h3>
<p>Maar ook als real-time informatieverschaffing geen noodzaak is, kan de actualiteit van de geleverde informatie nog steeds te wensen over laten. Als het rapport over consumentengedrag niet vandaag of morgen op het juiste bureau ligt, maar pas na drie maanden, loopt het bedrijf inderdaad kansen mis. De voor-de-hand-liggende vraag is dan: als de ict-verantwoordelijken zelf al aangeven hier ontevreden over te zijn, waarom doen ze er dan niets aan? Het is tenslotte hun verantwoordelijkheid – als zij het niet doen, wie dan wel?<br />
Dat vraagt gewoon om nader onderzoek. Blijkbaar zijn veel ict-afdelingen onvoldoende in staat om hun gebruikers van actuele informatie te voorzien; waar ligt dat aan? Wat is er voor nodig om daar verbetering in te brengen? Helaas, het Progress-onderzoek stopt net als het interessant wordt.</p>
<p>Het is in ieder geval te hopen dat organisaties bij het verbeteren van hun informatievoorziening verder zullen kijken dan de invoering van wéér een nieuw softwarepakket (al dan niet van Progress). Het stadium van “met een nieuwe tool verdwijnen al uw problemen als sneeuw voor de zon” zijn we nu toch zo langzamerhand wel voorbij.</p>
<p>Toch?</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=10" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/actuele-informatie-niet-zo-simpel-als-het-lijkt/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Data Vault: meer dan modellering</title>
		<link>http://blog.grey-matter.nl/data-vault-meer-dan-modellering/</link>
		<comments>http://blog.grey-matter.nl/data-vault-meer-dan-modellering/#comments</comments>
		<pubDate>Mon, 21 Apr 2008 12:39:35 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[architectuur]]></category>

		<category><![CDATA[datawarehousing]]></category>

		<category><![CDATA[Data Vault]]></category>

		<category><![CDATA[versions of the truth]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=8</guid>
		<description><![CDATA[Momenteel ben ik betrokken bij een datawarehouseproject waarbij gewerkt wordt volgens de Data Vault methodiek. Hoewel bepaald nog geen gemeengoed in de datawarehouse community, krijgt Data Vault langzamerhand meer bekendheid; zo zijn er inmiddels diverse artikelen over het onderwerp verschenen in DB/M. Belangrijkste bron van informatie zijn de whitepapers van Dan Linstedt, de founding father [...]]]></description>
			<content:encoded><![CDATA[<p>Momenteel ben ik betrokken bij een datawarehouseproject waarbij gewerkt wordt volgens de Data Vault methodiek. Hoewel bepaald nog geen gemeengoed in de datawarehouse community, krijgt Data Vault langzamerhand meer bekendheid; zo zijn er inmiddels diverse artikelen over het onderwerp verschenen in DB/M. Belangrijkste bron van informatie zijn de whitepapers van <a title="Dan Linstedt" href="http://www.danlinstedt.com">Dan Linstedt</a>, de founding father van Data Vault.</p>
<p>Wat in die publicaties echter onderbelicht blijft, is dat Data Vault veel meer is dan &#8220;alleen maar&#8221; datamodellering. Het geeft je niet alleen een uitstekend gereedschap in handen om je centrale datawarehouse te modelleren: het is ook een architectonische visie op de rol van het data warehouse in de overall BI-omgeving.</p>
<p><span id="more-8"></span>Eigenlijk is het eigenaardig dat die andere kant van Data Vault tot dusver in het openbaar wat op de achtergrond is gebleven. Want juist die andere kant biedt een radicaal andere visie op datawarehousing dan momenteel gangbaar is - één die naar mijn mening een hoop meerwaarde voor het vakgebied zou kunnen bieden.<br />
(&#8221;In het openbaar&#8221;, want de visie van Linstedt komt uitvoerig aan de orde tijdens de Data Vault certificatiecursus. Wie de cursus niet gevolgd heeft, moet het doen met <a title="Linstedts blog" href="http://www.b-eye-network.com/blogs/linstedt/">Linstedts blog</a>, waarin hij zijn kijk op de veranderende rol van het datawarehouse beschrijft.)</p>
<h3>System of fact</h3>
<p>In de Data Vault visie verschuift de rol van het datawarehouse van gegevensintegrator naar &#8220;system of record&#8221;, of, in de terminologie waar Linstedt de voorkeur aan geeft, &#8220;system of fact&#8221;. Uitgangspunt is dat alle data altijd geladen wordt: &#8220;100% of the data 100% of the time&#8221;. Er vindt geen cleansing plaats, geen uitval vanwege gebrekkige kwaliteit, geen toepassing van business rules, geen data-integratie.<br />
(Overigens vindt wel data<span style="text-decoration: underline;">model</span>integratie plaats: d.w.z. entiteiten uit onderliggende bronsysteemmodellen worden tot één Data Vault entiteit samengevoegd als ze qua grain overeenkomen, maar er vindt geen inhoudelijke merge plaats).</p>
<p>De toepassing van business rules, en alle activiteiten ten behoeve van cleansing, merging en integratie van data worden in de Data Vault aanpak gepositioneerd tussen het datawarehouse en de datamarts. Argumentatie daarbij is dat de gebruikers uiteindelijk eigenaar zijn van de gegevens, niet IT; en dat het dus de gebruiker is die bepaalt hoe je van data informatie maakt, niet de IT-afdeling.<br />
Op zichzelf is dat geen sterk argument: immers, ook als de gebruikers de regels bepalen, is het nog steeds prima denkbaar dat die regels direct al bij binnenkomst van de data worden toegepast. In het licht van de veranderlijkheid van requirements en business rules, is het echter wel verstandig om je bij het inrichten van je datawarehouse niet te laten leiden door het laatste inzicht van de gebruikers t.a.v. de relevante bedrijfsbegrippen: het datawarehouse is idealiter proces- en requirementsonafhankelijk. Linstedt bereikt dit door simpelweg de gegevens (de facts) vast te leggen zoals ze binnengekomen zijn, zonder al bij vastlegging een poging te doen tot interpretatie ervan; want die interpretatie is per definitie gedreven door de inzichten van vandaag, en daar wil je het system of record niet op inrichten.</p>
<h3>Compliance</h3>
<p>Deze tolerante, proces-agnostische houding ten opzichte van de binnengekomen data is volgens Linstedt onontbeerlijk, wil het datawarehouse compliance met initiatieven als Sarbanes-Oxley, Basel-II etc. kunnen ondersteunen. Dit vereist o.a. dat gerapporteerde gegevens auditable zijn; met andere woorden, van een gerapporteerd gegeven moet nagegaan kunnen worden, hoe het tot stand is gekomen. Bronsystemen houden zelf meestal geen historie bij, dus het datawarehouse is de enige historische opslagplaats voor alle brongegevens. Worden de gegevens bij binnenkomst bewerkt op basis van business rules, dan wordt de audit trail naar het oorspronkelijke brongegeven doorbroken. Compliance vereist dus vastlegging zonder interpretatie.</p>
<h3>Parallelle werkelijkheden</h3>
<p>Doordat de integratie van gegevens en de toepassing van business rules niet meer in het datawarehouse verankerd zijn, maar pas onderweg naar de datamarts plaatsvinden (áls dat al gebeurt), representeert het datawarehouse niet langer &#8220;one version of the truth&#8221;, maar eerder &#8220;one version of the facts&#8221;. Dat geeft ruimte om meerdere parallelle &#8220;versions of the truth&#8221; af te leiden, ieder geheel toegesneden op de wensen van zijn gebruikers. De Data Vault aanpak sluit daarmee aan bij de (<a href="http://www.capgemini.com/technology-blog/2008/01/top_10_of_business_intelligenc.php">steeds</a> <a href="http://blogs.oracle.com/frankbuytendijk/2008/02/19">luider wordende</a>) <a href="http://www.timoelliott.com/blog/2008/01/is_one_version_of_the_truth_ou.html">tegengeluiden</a> tegen de heilige graal van de &#8220;single version of the truth&#8221;: het is bepaald geen sinecure om een single version of the truth neer te zetten, en bovendien is het nog maar de vraag of onze gebruikers daar eigenlijk wel zo goed mee geholpen worden.</p>
<h3>New kid on the block</h3>
<p>Al met al wijkt de Data Vault aanpak dus aanzienlijk af van hoe we tot dusver onze datawarehouses ingericht hebben. Van Kimball hebben we geleerd om &#8220;one version of the truth&#8221; te creëren met behulp van conformed dimensions; en ook Inmon gaat uit van een geünificeerde kijk op geïntegreerde gegevens. (Het is in dat verband interessant om op te merken dat Inmon weliswaar zijn goedkeuring uitspreekt voor Data Vault als &#8220;<a href="http://www.danlinstedt.com/">the optimal choice for <em>modeling</em></a>&#8221; voor zijn DW 2.0, maar dat het DW 2.0-concept nog steeds voorziet in een integrated sector die data bevat die &#8220;[...] is used and understood universally across the corporation&#8221;.)</p>
<p>Na zelf jarenlang gewerkt te hebben in traditionele datawarehouse-omgevingen, geeft mijn huidige opdracht me een mooie gelegenheid om de Data Vault aanpak zelf te beproeven en te vergelijken met de gangbare praktijk.<br />
De &#8220;system-of-record&#8221;-invalshoek om het datawarehouse zo proces- en requirementsonafhankelijk mogelijk te maken, is zeker nader onderzoek waard; maar het ontbreken van afgedwongen gegevensintegratie vormt een behoorlijke beheersuitdaging. &#8220;Multiple versions of the truth&#8221; kunnen gemakkelijk ontaarden in een onoverzichtelijke, onbeheersbare wirwar van losse data-silootjes - net als in het pré-datawarehousetijdperk. (Is een datawarehouse dat op afroep iedere gewenste realiteit kan produceren, eigenlijk wel compliant?)</p>
<p>Kortom, het belooft een interessant project te worden.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=8" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/data-vault-meer-dan-modellering/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Tags als instrument voor business metadata</title>
		<link>http://blog.grey-matter.nl/tags-als-instrument-voor-business-metadata/</link>
		<comments>http://blog.grey-matter.nl/tags-als-instrument-voor-business-metadata/#comments</comments>
		<pubDate>Sun, 13 Apr 2008 20:15:57 +0000</pubDate>
		<dc:creator>Lidwine van As</dc:creator>
		
		<category><![CDATA[business intelligence]]></category>

		<category><![CDATA[BI2.0]]></category>

		<category><![CDATA[metadata]]></category>

		<guid isPermaLink="false">http://blog.grey-matter.nl/?p=6</guid>
		<description><![CDATA[Onlangs wierp een collega-architect de vraag op of het Web 2.0-concept &#8220;folksonomy&#8221; uitkomst zou kunnen bieden bij de vastlegging van business metadata. Tags zijn speciaal ontwikkeld als gereedschap voor het definiëren en categoriseren van begrippen; door functionaliteit voor &#8220;tagging&#8221; beschikbaar te stellen aan onze eindgebruikers, zijn zij niet meer gebonden aan de naamgeving die wij [...]]]></description>
			<content:encoded><![CDATA[<p>Onlangs wierp een collega-architect de vraag op of het Web 2.0-concept &#8220;<a title="Folksonomy" href="http://en.wikipedia.org/wiki/Folksonomy">folksonomy</a>&#8221; uitkomst zou kunnen bieden bij de vastlegging van business metadata. Tags zijn speciaal ontwikkeld als gereedschap voor het definiëren en categoriseren van begrippen; door functionaliteit voor &#8220;<a title="tags" href="http://en.wikipedia.org/wiki/Tag_%28metadata%29" target="_blank">tagging</a>&#8221; beschikbaar te stellen aan onze eindgebruikers, zijn zij niet meer gebonden aan de naamgeving die wij in de BI-omgeving hanteren (maar die voor hen misschien onvoldoende herkenbaar en bruikbaar is), maar kunnen ze zelf de begrippen benoemen en hernoemen.<br />
Het idee om tagging voor dit doel in te zetten komt ook terug in de BI 2.0-gedachte. Zijn folksonomies bruikbaar in een BI-omgeving?<br />
<span id="more-6"></span></p>
<h3>Folksonomy</h3>
<p>Tagging heeft waarde voor onszelf als individuen, omdat het ons in staat stelt om die gegevens (foto&#8217;s, filmpjes, blogposts, links) die voor ons van belang zijn, te ordenen volgens een indeling die het best bij onze eigen belevingswereld aansluit. Dat je niet gebonden bent aan 1 categorie, maar net zoveel tags aan een gegeven kunt hangen als je zelf zinnig vindt, is daarbij een groot voordeel.<br />
Tagging is daarnaast succesvol als sociaal instrument, doordat het mensen met een gedeelde belevingswereld en interesse met elkaar verbindt in termen van hun specifieke, gedeelde vocabulaire. Daarin schuilt ook een belangrijke beperking: lang niet iedere gedeelde interesse vertaalt zich naar een gedeeld vocabulaire. Als je op Flickr zoekt naar foto&#8217;s van wat mensen in hun tas meeslepen (om maar een doorsnee zoekopdracht te noemen), dan kun je die vinden onder de tag &#8220;<a title="whatsinmybag" href="http://www.flickr.com/photos/tags/whatsinmybag/">whatsinmybag</a>&#8220;, &#8220;<a title="whatsinyourbag" href="http://www.flickr.com/photos/tags/whatsinyourbag/">whatsinyourbag</a>&#8220;, &#8220;<a title="whatisinmybag" href="http://www.flickr.com/photos/tags/whatisinmybag/">whatisinmybag</a>&#8220;, &#8220;<a title="whatisinyourbag" href="http://www.flickr.com/photos/tags/whatisinyourbag/">whatisinyourbag</a>&#8220;, en wie weet, misschien ook wel onder &#8220;<a title="lookwhatsinmybag" href="http://www.flickr.com/photos/tags/lookwhatsinmybag/">lookwhatsinmybag</a>&#8221; of &#8220;<a title="kijkeenswaterinmijntaszit" href="http://www.flickr.com/photos/tags/kijkeenswaterinmijntaszit/">kijkeenswaterinmijntaszit</a>&#8221; (of &#8220;<a title="kijkeenswaterinmetaszit" href="http://www.flickr.com/photos/tags/kijkeenswaterinmetaszit/">kijkeenswaterinmetaszit</a>&#8221; - in de folksonomy is alles geoorloofd). Het is dus te hopen dat je geen totaaloverzicht van alle tassen-met-inhoudsfoto&#8217;s nodig hebt, want dat zit er niet in - in ieder geval niet op basis van tagging.<br />
Keerzijde hiervan is dat eenzelfde tag door verschillende individuen voor andere begrippen gebruikt kan worden. Zo vind je bij Flickr onder de tag &#8220;<a title="notebook" href="http://www.flickr.com/photos/tags/notebook/">notebook</a>&#8221; zowel foto&#8217;s van notitieboekjes als van laptops.</p>
<h3>BI: eenduidigheid is alles</h3>
<p>Het is niet voor niets dat sites die belang hebben bij compleetheid, correctheid en eenduidigheid van informatie, tagging niet of maar in beperkte mate aanbieden. Denk bijvoorbeeld aan Wikipedia: lemma&#8217;s worden gecategoriseerd in een opgelegde structuur, zonder ruimte om eigen tags te definiëren en aan artikelen te hangen. Denk ook aan Marktplaats, waar advertenties in strikte, voorgedefinieerde categorieën ondergebracht zijn. Uiteraard is die strakke indeling in het belang van zowel aanbieder als geïnteresseerde: hoe zou je een 5 jaar oude zilvergrijze Polo moeten taggen om zoveel mogelijk geïnteresseerden te trekken? En op welke tags zou je moeten zoeken om precies die 5 jaar oude zilvergrijze Polo te vinden?  </p>
<p>Dit is exact de reden waarom we er in BI-land zo aan hechten om strakke definities af te spreken en business metadata vast te leggen. Het zijn nou juist de verschillen in begrippenkader tussen gebruikers onderling die voor problemen zorgen. Zo hebben binnen een onderneming de meeste afdelingen en gebruikersgroepen wel op één of andere manier interesse in de klant; bij doorvragen zou echter weleens kunnen blijken dat ze allemaal iets anders onder &#8220;klant&#8221; verstaan. Voor de salesmanager is een klant iedereen aan wie hij ooit een offerte heeft uitgebracht, voor de debiteurenadministratie is het iedereen die ooit een factuur toegezonden heeft gekregen, etc. Is er een taggingmechanisme beschikbaar, dan zullen al deze gebruikers het labeltje &#8220;klant&#8221; op hun klantconcept plakken. Zijn de tags zichtbaar voor alle gebruikers, dan is de spraakverwarring niet te overzien - jammer van al die moeite die we in het conformeren van de dimensies hebben gestoken.</p>
<h3>Slagroom op de taart</h3>
<p>Vanuit BI-oogpunt schuilt het gevaar hem dus met name in de <em>communicatie</em> tussen groepen met verschillende begrippenkaders. Voor deze communicatie zal altijd een eenduidige, geformaliseerde begrippenstructuur nodig zijn. Tagging leent zich hier niet voor. Als je het sociale aspect achterwege laat, zouden tags echter prima bruikbaar kunnen zijn als aanvulling op de formele structuur. Tags stellen individuele gebruikers(groepen) in staat om meer grip te krijgen op de voor hen bestemde informatie. Gebruikersgroepen die intern een benaming hanteren die het niet gehaald heeft als businessdefinitie in de formele structuur, kunnen d.m.v. tags alsnog hun eigen vertrouwde terminologie loslaten op hun rapportages.<br />
In het hierboven aangehaalde voorbeeld, zouden alle afdeling de tag &#8220;klant&#8221; aan hun klantgerelateerde rapporten mogen hangen, ook al zou de klant van Sales in de BI-omgeving eigenlijk &#8220;prospect&#8221; heten.</p>
<p>Als bonus kan tagging ons, &#8220;de makers&#8221;, meer inzicht geven in de denkwereld van onze gebruikers. Analyseer hoe de gebruikers hun gegevens taggen, en ontdek dat de hele onderneming businessterm B gebruikt, hoewel businessterm A tijdens de informatie-analyse als beste uit de bus kwam. Ontdek ook dat afdeling 1, 2 en 3 hun rapporten allemaal taggen met begrip C, terwijl ze eigenlijk resp. D, E en F bedoelen. Hoe beter we de gebruiker kennen, hoe beter we hem kunnen ondersteunen.</p>
<h3>(A)sociaal</h3>
<p>Tagging kan dus wel degelijk nut hebben voor BI-omgevingen, maar dan wel zonder het sociale aspect wat in Web 2.0 zo belangrijk is. Het zou interessant zijn om te onderzoeken of dat ook opgaat voor andere Web 2.0-kenmerken die relevant zijn voor BI 2.0; maar dat is voer voor een toekomstige blogposting.</p>
<p>&copy;2010 <a href="http://blog.grey-matter.nl">42 Versions of the Truth</a>. All Rights Reserved.</p>. <img src="http://blog.grey-matter.nl/wp-content/plugins/feed-statistics.php?view=1&post_id=6" width="1" height="1" style="display: none;" />]]></content:encoded>
			<wfw:commentRss>http://blog.grey-matter.nl/tags-als-instrument-voor-business-metadata/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>
