tag:blogger.com,1999:blog-350557212024-03-05T16:05:09.606+01:00DatabikkelEen mix en mash blog over Business Intelligence, Datawarehousing, Datamining, Datavisualisatie, Personal Intelligence, Web2.0 en Search.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.comBlogger69125tag:blogger.com,1999:blog-35055721.post-55657045900853637932009-03-01T01:12:00.022+01:002009-03-03T09:42:55.122+01:00De meest sexy job voor de komende 10 jaar<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjw3pM4-2INTycQladIyQ1B4lTd4jw7nIMKW-KJmYfZtYvXmvsI1u8iYDqD5r2UE4ippwSoLUFS5xubr_LK1pC9Pe9OJxCSYywZw8LyQ3PxeROBez8l1irwF1Jb3p7-pjokcaRQrg/s1600-h/varian.png"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;width: 320px; height: 230px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjw3pM4-2INTycQladIyQ1B4lTd4jw7nIMKW-KJmYfZtYvXmvsI1u8iYDqD5r2UE4ippwSoLUFS5xubr_LK1pC9Pe9OJxCSYywZw8LyQ3PxeROBez8l1irwF1Jb3p7-pjokcaRQrg/s320/varian.png" border="0" alt=""id="BLOGGER_PHOTO_ID_5308359304403162722" /></a><br /><br />Het is dan wel niet <a href="http://www.ad.nl/buitenland/2928195/Stormloop_op_de_beste_baan_ter_wereld.html">de beste baan ter wereld</a>, maar <a href="http://www.mckinseyquarterly.com/Hal_Varian_on_how_the_Web_challenges_managers_2286">statisticus is de komende 10 jaar de meest sexy baan ter wereld</a>. Althans volgens Hal Varian, de chief economist van Google (en auteur van <a href="http://www.inforules.com/">Information Rules</a> één van de <a href="http://money.cnn.com/magazines/fortune/fortune_archive/2005/03/21/8254826/index.htm">beste boeken over online strategieën</a>) in een video interview met de <a href="http://www.mckinseyquarterly.com/home.aspx">McKinsey Quarterly</a>:<br /><br /><blockquote><span style="font-style:italic;">"People think I’m joking, but who would’ve guessed that computer engineers would’ve been the sexy job of the 1990s? The ability to take data—to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it—that’s going to be a hugely important skill in the next decades, not only at the professional level but even at the educational level for elementary school kids, for high school kids, for college kids. Because now we really do have essentially free and ubiquitous data. So the complimentary scarce factor is the ability to understand that data and extract value from it."</span></blockquote><br />En nog een aardige quote over een skillset die managers moeten hebben in organisaties waar informatie geen schaars goed meer is:<br /><blockquote><span style="font-style:italic;">"Managers need to be able to access and understand the data themselves.[...] In the old organization, you had to have this whole army of people digesting information to be able to feed it to the decision maker at the top. But that’s not the way it works anymore: the information can be available across the ranks, to everyone in the organization. And what you need to ensure is that people have access to the data they need to make their day-to-day decisions."</span></blockquote><br />De Mckinsey Quarterly heeft overigens nog meer video interviews die zeer de moeite van het kijken waard zijn. BV <a href="http://www.mckinseyquarterly.com/Googles_view_on_the_future_of_business_An_interview_with_CEO_Eric_Schmidt_2229">Dit interview met de CEO van Google</a>, Eric Schmidt, waarin hij o.a. stelt dat de <a href="http://en.wikipedia.org/wiki/The_Long_Tail">Long Tail</a> niet de plek is waar bedrijven de meeste omzet maken.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-46687949978720198382009-02-17T10:00:00.017+01:002009-02-18T22:36:16.209+01:00Dataintegratie op AWS<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhSPbovHE2KPpvcyRU_IuPjidqxCrqwZvdXTa4b488ADSX9pqBiRK4ulidFACzuPVxN6M8eiDNRWK40fAYygcevl89CO9fh96cbfREKl3VTb4e9eF6ovLbTnBXeflUa8J58ktGzPQ/s1600-h/snaplogic.png"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;width: 320px; height: 157px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhSPbovHE2KPpvcyRU_IuPjidqxCrqwZvdXTa4b488ADSX9pqBiRK4ulidFACzuPVxN6M8eiDNRWK40fAYygcevl89CO9fh96cbfREKl3VTb4e9eF6ovLbTnBXeflUa8J58ktGzPQ/s320/snaplogic.png" border="0" alt=""id="BLOGGER_PHOTO_ID_5303560150522097026" /></a><br /><br />Mijn vorige post ging over <a href="http://blog.databikkel.nl/2009/01/datawarehousing-op-aws-simpledb-en.html">dbms-en voor datawarehouses op EC2</a>. Ik was blijven steken bij de vraag, hoe je de gegevens naar <a href="http://aws.amazon.com/ec2/">EC2</a> kunt transporteren en daar kunt integreren. Ik heb een lijstje gemaakt van dataintegratietools die iets met AWS doen.<br /><br />Wat opvalt is dat het bijna allemaal open source dataintegratietools zijn. Niet heel verwonderlijk want het huidige businessmodel voor commerciële software past 'niet helemaal' bij het cloudconcept i.e. alleen betalen voor het gebruik. <br /><br />Open source is in principe gratis en daardoor lijken cloudcomputing en open source een symbiotisch droomkoppel. <a href="http://www.talend.com/blog/2009/02/05/the-crisis-a-catalyst-for-innovation/">De huidige crisis kan zelfs als katalysator werken</a> voor een snelle acceptatie van deze combi. Al zijn er volgens UC berkeley nog een aantal belangrijke <a href="http://thedmblog.wordpress.com/2009/02/13/cloud-computing-berkeleys-view/">obstakels voor cloudcomputing</a> en zijn er volgens Informationweek nog <a href="http://www.informationweek.com/news/services/saas/showArticle.jhtml;jsessionid=1W14JFDXURML2QSNDLPCKH0CJUNN2JVN?articleID=212701147">6 dingen die SAAS moet doen</a> om in 2009 als volwaardige technologie geaccepteerd te worden.<br /><br /><span style="font-weight:bold;">De dataintegratietools voor AWS.</span><br /><br /><span style="font-weight:bold;">Logixml</span><br /><a href="http://www.logixml.com/Search/search.aspx?cx=010207712022908245411%3Armx4zx9xje4&cof=FORID%3A11&ie=UTF-8&q=simpledb&sa.x=0&sa.y=0&sa=Search#327">logixml</a> is een BI platform met een etl-component dat connecteert naar <a href="http://aws.amazon.com/simpledb/">Simpledb</a>, <a href="http://www.salesforce.com">Salesforce</a> en willekeurig andere webservices. Het is de enige niet opensource tool.<br /><br /><span style="font-weight:bold;">Apatar</span><br /><a href="http://www.apatar.com/why_apatar.html">Apatar is opensource dataintegratie software</a> met connectoren voor SAP, siebel, <a href="http://www.sugarcrm.com/crm/">Sugarcm</a> en AWS.<br /><span style="font-weight:bold;"><br />Snaplogic</span><br />Open source dataintegratietool voor SAAS applicaties, <a href="http://www.snaplogic.com/aws">Snaplogic, is geoptimaliseerd voor AWS</a>. <br /><br /><span style="font-weight:bold;">Pentaho</span><br />Maar <a href="http://www.pentaho.com/">Pentaho</a> is volgens mij het meest ver met AWS. <a href="http://blog.vmdatamine.com/">Het blog VM Datamining</a> heeft een <a href="http://blog.vmdatamine.com/search/label/EC2">serie posts over de installatie van Pentaho Data Integration oftewel kettle op EC2</a>. Matt Casters, de architect van Kettle beschrijft op zijn blog dat <a href="http://www.ibridge.be/?p=113">Kettle zeer overtuigend schaalt op EC2</a> en stelt dat AWS ongekende mogelijkheden biedt tegen zeer lage kosten. <br /><br />Bovendien komt er blijkbaar binnenkort <a href="http://forums.pentaho.org/showthread.php?p=205153">een AMI (Amazon Machine Image) voor Pentaho Data Integration.</a> Er is is zelfs al op AWS een datawarehouse gebouwd met Mysql en Pentaho. Zo onrijp, zoals ik in mijn <a href="http://nlbi.blogspot.com/2009/02/datawarehousing-op-aws-simpledb-en.html">vorige post</a> stelde, is AWS als dwhplatform dus ook weer niet.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com2tag:blogger.com,1999:blog-35055721.post-45009293662960005472009-01-21T10:51:00.000+01:002009-01-21T10:49:45.670+01:00Datawarehousing op AWS: simpleDB en ander dbmsenCloudcomputing belooft onbeperkte, schaalbare en betaalbare rekencapaciteit en opslag. Dat lijkt een ideaal platform voor een datawarehouse-omgeving. Nu <a href="http://en.wikipedia.org/wiki/Amazon_Elastic_Compute_Cloud">Amazon's Web Service Elastic Compute Cloud</a> (EC2) naar Europa komt, <a href="http://en.wikipedia.org/wiki/Google_App_Engine">Google's App Engine</a> al weer een aantal maanden in beta is en zelfs microsoft met <a href="http://en.wikipedia.org/wiki/Azure_Services_Platform">azure</a> de pc aan het verlaten is, is het hoog tijd om eens kleine verkenning te maken van de analytische capaciteiten van <a href="http://aws.amazon.com/">Amazon Web Services</a>, App Engine en Azure. Temeer omdat 2 cloudomgevingen een eigen dbms hebben die enorme hoeveelheden data kunnen verwerken. Voor Amazon is dat <a href="http://en.wikipedia.org/wiki/SimpleDB">SimpleDB</a> en Google heeft zijn <a href="http://en.wikipedia.org/wiki/BigTable">Bigtable</a>. In deze post de datawarehouses databases voor Amazon Web Services (AWS) in vogelvlucht. In een volgende post App Engine, Bigtable en de integratietools voor AWS.<br /><br /><br />Bij AWS betaal je alleen voor het gebruik van processortijd en opslag. Een complete machine huren zoals bij hostingdiensten gebruikelijk is, is niet nodig. Belangrijk om te weten is dat in de gebruikskosten van AWS de licentiekosten al zijn meegenomen.<br /><br /><span style="font-weight:bold;">Databases in de cloud.</span><br />Je hebt standaard de keuze uit <a href="http://aws.amazon.com/ec2/#os">windows server 2003, verschillende smaken linux en een aantal databases</a>. EC2 ondersteunt <a href="http://aws.amazon.com/ec2/running_databases/">Oracle 11g en de Oracle express edition</a>, <a href="http://developer.amazonwebservices.com/connect/entry!default.jspa;jsessionid=4E0855C794E869D2AAB05EFDE31907CD?categoryID=112&externalID=1663&fromSearchPage=true">Mysql</a>, <a href="http://aws.amazon.com/windows/">sqlserver standard en express edition</a> en de zelf ontwikkelde <a href="http://aws.amazon.com/simpledb/">simpleDB</a>. Dus zo'n virtuele machine is in principe te richten met alle dwh-componenten van die dbms-en. En dit biedt in potentie de mogelijkheid om data warehouses als managed service aan te bieden, iets wat startup <a href="http://kognitio.com/index.php">Kognitio</a> al een tijdje probeert.<br /><br /><span style="font-weight:bold;">Oracle</span><br />Oracle biedt via <a href="http://www.oracle.com/goto/cloud/index.html">het Oracle Cloud Computing Center</a> ondersteuning van Oracle producten, maar Oracle's marketingmachine meldt nog niets over een virtuele voorgeconfigureerde ami (amazon machine image) die geoptimaliseerd is voor datawarehousing. Eigenlijk wil je op AWS een soort <a href="http://www.oracle.com/solutions/business_intelligence/optimized-warehouse-initiative.html">Oracle Optimized Warehouse</a>.<br /><div style="width:425px;text-align:left" id="__ss_853950"><a style="font:14px Helvetica,Arial,Sans-serif;display:block;margin:12px 0 3px 0;text-decoration:underline;" href="http://www.slideshare.net/JustinKestelyn/oracle-in-the-cloud-aws-webinar-presentation?type=powerpoint" title=""Oracle in the Cloud" AWS Webinar">"Oracle in the Cloud" AWS Webinar</a><object style="margin:0px" width="425" height="355"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=oraclewebinardeckfinal-1229533833143575-1&stripped_title=oracle-in-the-cloud-aws-webinar-presentation" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=oraclewebinardeckfinal-1229533833143575-1&stripped_title=oracle-in-the-cloud-aws-webinar-presentation" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object><div style="font-size:11px;font-family:tahoma,arial;height:26px;padding-top:2px;">View SlideShare <a style="text-decoration:underline;" href="http://www.slideshare.net/JustinKestelyn/oracle-in-the-cloud-aws-webinar-presentation?type=powerpoint" title="View "Oracle in the Cloud" AWS Webinar on SlideShare">presentation</a> or <a style="text-decoration:underline;" href="http://www.slideshare.net/upload?type=powerpoint">Upload</a> your own. (tags: <a style="text-decoration:underline;" href="http://slideshare.net/tag/amazon">amazon</a> <a style="text-decoration:underline;" href="http://slideshare.net/tag/aws">aws</a>)</div></div> <a href="http://www.full360.com/home">Full360</a> is alvast in deel van het gat dat Oracle laat, gesprongen en biedt hostingoplossingen op EC2 voor Oracle EPM (voorheen Essbase). Hun avonturen op EC2 zijn te volgen via het <a href="http://www.full360.com/blog">full360-blog</a>. Opvallend is dat Oracle los van AWS <a href="http://www.oracle.com/newsletters/information-indepth/business-intelligence/jan-09/hyperion.html?msgid=7312298">een on demand omgeving aanbiedt voor EPM</a>.<br /><br /><span style="font-weight:bold;">Sqlserver</span><br />Sinds oktober 2008 zijn <a href="http://www.readwriteweb.com/archives/amazons_ec2_out_of_beta_and_windows_support.php">windows server en Sql Server beta op EC2</a>. Microsoft biedt nog geen extra ondersteuning voor EC2 en is itt <a href="http://aws.amazon.com/solutions/featured-partners/">Oracle en Sun-Mysql geen partner</a> van AWS. De publieke ami's (amazon machine images) voor Windows Server 2003 en Sqlserver 2005 standard edition bevat <a href="http://developer.amazonwebservices.com/connect/thread.jspa?threadID=26400">GEEN bi development studio</a>. Je kunt natuurlijk met een eigen licentie een installatie uitvoeren, maar dat doet het kostenvoordeel van AWS weer teniet.<br /><br /><span style="font-weight:bold;">Mysql</span><br /><a href="http://www.mysql.com/products/enterprise/ec2.html">Mysql ondersteunt op EC2 de enterprise edition</a>. Dat is dus de betaalde versie en niet de community versie. Bij Mysql staan nog geen expliciete vermeldingen van dwh-toepassingenen in de cloud. Mysql blijft volgens <a href="http://www.greenplum.com/Gartner-MQ/">Gartner's MQ voor dwh dbms-en van december 2008</a> ook steken in het nicheplayerkwadrant.<br /><br /><span style="font-weight:bold;">Vertica</span><br />En dan er is ook nog een andere datawarehouse nichespeler, de kolom geörienteerde BI database Vertica die een <a href="http://www.vertica.com/cloud">een ondemand versie op EC2 heeft</a>.<br /><br /><div style="width:425px;text-align:left" id="__ss_614448"><a style="font:14px Helvetica,Arial,Sans-serif;display:block;margin:12px 0 3px 0;text-decoration:underline;" href="http://www.slideshare.net/tracylaxdal/vertica-and-amazon-web-services-presentation?type=powerpoint" title="Vertica and Amazon Web Services">Vertica and Amazon Web Services</a><object style="margin:0px" width="425" height="355"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=vertica-aws-seminar-1222208986205220-9&stripped_title=vertica-and-amazon-web-services-presentation" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=vertica-aws-seminar-1222208986205220-9&stripped_title=vertica-and-amazon-web-services-presentation" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object><div style="font-size:11px;font-family:tahoma,arial;height:26px;padding-top:2px;">View SlideShare <a style="text-decoration:underline;" href="http://www.slideshare.net/tracylaxdal/vertica-and-amazon-web-services-presentation?type=powerpoint" title="View Vertica and Amazon Web Services on SlideShare">presentation</a> or <a style="text-decoration:underline;" href="http://www.slideshare.net/upload?type=powerpoint">Upload</a> your own. (tags: <a style="text-decoration:underline;" href="http://slideshare.net/tag/aws">aws</a> <a style="text-decoration:underline;" href="http://slideshare.net/tag/vertica">vertica</a>)</div></div><br /><br /><span style="font-weight:bold;">simpleDB</span><br />Een uniek sellingpoint van AWS is de database <a href="http://aws.amazon.com/simpledb/">simpledB</a>. SimpleDB is <a href="http://aws.amazon.com/simpledb/#details">geen relationele database</a>, maar <a href="http://www.satine.org/archives/2007/12/13/amazon-simpledb/">SimpleDB is supersnel, kan grote datasets aan en is schaalbaar</a>.<br /><br /><blockquote><span style="font-style:italic;">An Amazon SimpleDB domain is like a worksheet, items are like rows of data, attributes are like column headers, and values are the data entered in each of the cells. However unlike a spreadsheet, Amazon SimpleDB allows for multiple values to be associated with each “cell” (e.g., for item “123,” the attribute “color” can have both value “blue” and value “red”). Additionally, in Amazon SimpleDB, each item can have its own unique set of associated attributes (e.g., item “123” might have attributes “description” and “color” whereas item “789” has attributes “description,” “color” and “material”).</span></blockquote><br /><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgG40eGcSPMfwu4NrU3LS4PlEv1P76s6X4OZOcxB3FGlDsuE64Xgx2kymhHCRWNX3iOud3VZyKBfMO4vVxruc40tJSqiMsULMDU_sictpPTlYvcpYmUsZ3naK07PjqXDSJwxYTWsQ/s1600-h/simpleDBdomein.png"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;width: 320px; height: 88px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgG40eGcSPMfwu4NrU3LS4PlEv1P76s6X4OZOcxB3FGlDsuE64Xgx2kymhHCRWNX3iOud3VZyKBfMO4vVxruc40tJSqiMsULMDU_sictpPTlYvcpYmUsZ3naK07PjqXDSJwxYTWsQ/s320/simpleDBdomein.png" border="0" alt=""id="BLOGGER_PHOTO_ID_5293165244802019330" /></a><br /><br />De querytaal wijkt daarom ook af van SQL, hoewel er ook een <a href="http://aws.amazon.com/about-aws/whats-new/2008/12/17/new-sql-like-select-api-for-amazon-simpledb/">SQL-achtige SELECT api aangekondigd</a> is. Hier staat een <a href="http://developer.amazonwebservices.com/connect/entry.jspa?externalID=1231&categoryID=152">eenvoudige uitleg over de simpleDb-querytaal</a>. Niet iedereen is het er over eens dat <a href="http://www.ryanpark.org/2008/04/top-10-avoid-the-simpledb-hype.html">SimpleDB zo'n goed idee is</a>. Niet zo verwonderlijk want s simpleDB is nog Beta. Een sort op queryresultaten is bv <a href="http://aws.typepad.com/aws/2008/07/new-features-co.html">later toegevoegd</a> en er ontbreken (nog) aggregatiefuncties zoals 'group by' en 'sum'. Anderen zien <a href="http://gigaom.com/2007/12/14/amazon-simple-db/">simpleDB als een baanbrekende nieuwe technologie</a>. <br /><br /><span style="font-weight:bold;">Mapreduce</span><br />EC2 heeft nog een interessante optie voor omvangrijke data-analyses, want het maakt gebruik van <a href="http://hadoop.apache.org/core/">Hadoop</a>, de opensource tegenhanger van Google's <a href="http://en.wikipedia.org/wiki/MapReduce">mapreduce</a>. <a href="http://www.greenplum.com/resources/mapreduce/">Greenplum hypet zijn implementatie van mapreduce</a> als een belangrijk verkoopargument. Hadoop is simpel gezegd een manier om grote datasets parallel te verwerken. Door het elastisch kunnen schalen van het aantal processoren verloopt Hadoop erg efficiënt op AWS.<br /><br /><span style="font-weight:bold;">Conclusies</span><br />Volgens mij valt wel te concluderen dat AWS zeer veelbelovend is als data warehouseomgeving. Het biedt kleine bi-spelers bv de mogelijkheid om dwh-diensten aan te bieden zonder zelf een kostbaar serverpark met dure sofwarelicenties te moeten beheren. Maar de huidige software voor AWS is nog niet rijp genoeg voor serieuze datawarehouse toepassingen. <br /><br />Bij de huidige sqlserver aanbiedingen van AWS missen bv. de datawarehousefuncties. Zelfs het verkoopapparaat van Oracle maakt nog geen claims en simpleDB is technologisch nog niet geschikt voor dwh-analyses. Maar de ontwikkelingen gaan razendsnel en het zal waarschijnlijk langer duren om bedrijven ervan te overtuigen om strategische bedrijfsdata extern te hosten. En er is nog een ander probleem: hoe krijg je die data naar AWS ge-etled. Daarover meer in een van de volgende posts.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-60718973552431113042009-01-01T23:58:00.028+01:002009-01-21T10:50:31.531+01:00Een tegenslag voor het analyseren van openbare datasetsDe komst van de <a href="http://www.wired.com/science/discoveries/magazine/16-07/pb_intro"> petabyte age</a> lijkt helaas een kleine vertraging op te lopen. <a href="http://www.chemspider.com/blog/the-google-datasets-project-comes-to-an-end-oh-my-chemistry-who-cares-for-you.html">Google's palimpsestproject aka google research datasets is namelijk gekilled</a> voordat het gelanceerd is. <br /><br />Het idee was dat Google terabytes aan grote wetenschappelijke datasets op haar servers zou verzamelen en distribueren aan een ieder die deze data zou willen analyseren. De wijze van analyseren van wetenschappelijke data (en in een later stadium bedrijfsdata...?) zou hierdoor <a href="http://pimm.wordpress.com/2007/09/25/googles-palimpsest-project-promiscuous-distribution-of-all-science-data-sets/">volgens kenners dramatisch veranderen</a>. In de slideshow zie je een aantal van die wetenschappelijke projecten. <div style="width:425px;text-align:left" id="__ss_117919"><object style="margin:0px" height="355" width="425"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=googles-palimpsest-project3922"/><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=googles-palimpsest-project3922" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object><div style="font-size:11px;font-family:tahoma,arial;height:26px;padding-top:2px;"><a href="http://www.slideshare.net/?src=embed"><img src="http://static.slideshare.net/swf/logo_embd.png" style="border:0px none;margin-bottom:-5px" alt="SlideShare"/></a> | <a href="undefined" title="View this slideshow on SlideShare">View</a> | <a href="http://www.slideshare.net/upload">Upload your own</a></div></div>.<br /><br /><a href="http://news.bbc.co.uk/2/hi/technology/6425975.stm">De naam Google palimpsest</a> is afkomstig van het <a href="http://archimedespalimpsest.org/index.html">Archimedes palimpsest project</a> dat een rechtstreekse kopie van een tekst van Archimedes op perkament aan het ontcijferen is. Die tekst is weggekrast en overschreven met gebeden. Het perkament is verknipt en opnieuw ingebonden als gebedenboek. <br /><br />Het project wil de data openbaar maken om andere wetenschappers erbij te betrekken. Het probleem is de distributie van meer dan een terabyte aan data. In een Googletechtalk komt dit allemaal ter sprake (<a href="http://www.amazon.com/exec/obidos/ASIN/030681580X">het boek de archimedes codex</a> is overigens ook zeer de moeite van het lezen waard). <br /><br /><object width="425" height="344"><param name="movie" value="http://www.youtube.com/v/gME6fsCvonU&hl=en&fs=1"></param><param name="allowFullScreen" value="true"></param><param name="allowscriptaccess" value="always"></param><embed src="http://www.youtube.com/v/gME6fsCvonU&hl=en&fs=1" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="344"></embed></object><br /><br />Waarom Google stopt met google research datasets is niet duidelijk. Opvallend is dat Amazon juist het tegenovergestelde doet en heeft aangekondigd om een aantal <a href="http://aws.amazon.com/publicdatasets/">grote openbare datasets op haar Amazon Web Services platform</a> te hosten. Catch is dat als je een set wilt analyseren, je zult moeten betalen. <br /><br />Maar het is voor Amazon's elastic cloud natuurlijk ook een <a href="http://searchdatamanagement.techtarget.com/news/article/0,289142,sid91_gci1315359,00.html#">mooie showcase voor ondemand datawarehouses en analyses</a>. Er zijn al een aantal softwarebedrijven die zich richten op datawarehousen in de elastische wolk van Amazon. In een andere post daarover meer..Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-50947083193737906852008-12-28T23:20:00.003+01:002009-02-20T11:41:14.197+01:00Boek: The Numerati<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj73mmreiJIgJiO6GFvccm0-knJwRuoBxNueG-Xf3iPIqDzmedx7NnSpUNHwAiGBqmSnxlp3ZrArlybADostyAWgnQIVJaLXg-5_x4yxaGOhShb7ddwU2FIRmVqVES3qDXlDqXVpQ/s1600-h/numerati.png"><img style="float:left; margin:0 10px 10px 0;cursor:pointer; cursor:hand;width: 230px; height: 320px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj73mmreiJIgJiO6GFvccm0-knJwRuoBxNueG-Xf3iPIqDzmedx7NnSpUNHwAiGBqmSnxlp3ZrArlybADostyAWgnQIVJaLXg-5_x4yxaGOhShb7ddwU2FIRmVqVES3qDXlDqXVpQ/s320/numerati.png" border="0" alt=""id="BLOGGER_PHOTO_ID_5285004376104805410" /></a><br /><br />Een criterium voor een goed nonfictie boek is als je na het lezen de wereld (een beetje) anders gaat bekijken. <a href="http://www.amazon.com/Numerati-Stephen-Baker/dp/0618784608">The Numerati van Stephen Baker</a> is zo'n boek. <br /><br />Numerati zijn personen die via algoritmes op zoek zijn naar patronen in data die het menselijk leven en gedrag beschrijven. Dat klinkt wat vaag, maar aan de hand van 5 rollen maakt hij feilloos duidelijk dat de machines die de Numerati bouwen steeds meer zinnige dingen kunnen beweren over ons gedrag. Die rollen zijn: de werker, de shopper, de stemmer, de blogger, de terrorist, de patiënt en de lover.<br /><br />Ik zal er een paar heel kort (het blijft een blog) uitlichten. <br /><br />In <a href="http://www.businessweek.com/magazine/content/08_36/b4098032904806.htm?chan=magazine+channel_top+stories">'de werker' beschrijft hij</a> hoe IBM zijn 50.000 werknemers via wiskundige modellen de productiviteit wil verbeteren en het management wil automatiseren. <br /><br />In 'de stemmer' lees je dat <a href="http://blog.wired.com/27bstroke6/2008/11/barack-obamas-p.html">Obama niet alleen vanwege zijn charisma</a> de verkiezingen heeft gewonnen. <br /><br />In 'de terrorist' wordt duidelijk waarom datamining niet zal werken als middel om terrorisme te voorkomen. Dat zegt ook wat over de realiteitszin van het boek omdat onlangs ook een rapport is verschenen waarin staat dat de <a href="http://blog.wired.com/27bstroke6/2008/10/data-mining-for.html">anti terroristische datamining programma's van Homeland security niet werken </a>. <br /><br />En in 'de patient' blijkt dat <a href="http://www.highbeam.com/doc/1G1-114647344.html">Intel met sensortechnologie</a> een grote rol wil gaan spelen in de gezondheidszorg. Let maar eens op de nieuwsberichten van Intel.<br /><br />Het boek is fascinerend vanwege de mogelijkheden die deze algoritmes bieden en tegelijkertijd een waarschuwing tegen het vastleggen van persoonlijke gegevens. Zo voert Baker <a href="http://jeffjonas.typepad.com/jeff_jonas/">Jeff Jonas</a> op. Hij is een <a href="http://jeffjonas.typepad.com/jeff_jonas/2008/11/the-dissenting-numerati.html">bekeerd numerator</a> die zijn virtuele privacy frankenstein heeft verkocht aan IBM. Daar is hij nu hoofd entity analysis en ontwikkelt hij nu vooral methoden om persoons- en gedragsgegevens anoniem op te slaan.<br /><br /><a href="http://thenumerati.net/">Baker is ook een blog gestart over the numerati.</a> Fortune heeft het boek gekozen in zijn <a href="http://money.cnn.com/2008/12/24/technology/hempel_books.fortune/index.htm">top 3 van beste webboeken van 2008</a>.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-63704321886995229592008-12-10T00:01:00.001+01:002008-12-29T01:45:26.147+01:00rss als annotatie-hulpmiddel in rapportages<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjG_hD1UKQGLSElQbhP2n1FQ1WcNMbz7rJYApFbfmmDSn67vxsCNoNjQT67fxHxvS-WouQt6WDJ5Xy_jcHyZSqj9myU4n3BOZf8GWJo5sFLu0HwLbRuTvaP3Cswv_tiLlJYP45wmw/s1600-h/rssfeedgrafiek.jpg"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;width: 400px; height: 105px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjG_hD1UKQGLSElQbhP2n1FQ1WcNMbz7rJYApFbfmmDSn67vxsCNoNjQT67fxHxvS-WouQt6WDJ5Xy_jcHyZSqj9myU4n3BOZf8GWJo5sFLu0HwLbRuTvaP3Cswv_tiLlJYP45wmw/s400/rssfeedgrafiek.jpg" border="0" alt=""id="BLOGGER_PHOTO_ID_5277938999648325778" /></a><br /><br />Ik ben een groot fan van de grafieken van Google <a href="http://www.google.com/insights/search/#">insights for search</a> en <a href="http://finance.google.com/finance">finance</a>. Zie bv hoe Google de beurskoers van mijn favoriete <a href="http://finance.google.com/finance?q=NYSE:NZ">aandeel Netezza</a> integreert met belangrijke gebeurtenissen. Dat is toch weer fraai gedaan door <a href="http://googleblog.blogspot.com/2008/04/what-makes-design-googley.html">de interface ontwerpers van Google</a>. <br /><br />Ik vroeg me af of het ook mogelijk is zelf dergelijke rapportages te bouwen. <br />Zo zou je je kunnen voorstellen dat de marketeers van een krant willen weten welke nieuwsfeiten van invloed zijn op de losse verkoop. <br /><br />Die nieuwsfeiten zijn als rss-feed opvraagbaar en die moet je op een of andere manier verwerken als annotaties bij de verkoopcijfers. Nog beter zou het zijn als je uit Google Analytics als rss-feed de best bekeken artikelen zou kunnen opvragen, om te zien welk nieuwsfeit die dag belangrijk was. Helaas is dat laatste nog niet mogelijk. <br /><br />Overigens kun je ook heel gemakkelijk bedrijfsinterne nieuwsfeiten vastleggen in de vorm van een weblog, waarin je vastlegt wanneer bv het bronsysteem is gemigreerd. De rss-feed van dat weblog verklaart dan weer de trendbreuk in die ene grafiek.<br /><br />Google spreadsheets heeft de mogelijkheid om annotaties te maken in de vorm van <a href="http://www.google.com/support/writely/bin/answer.py?hl=en&answer=91609">interactieve time series gadget</a> van Google. Het is ook vrij gemakkelijk een rss-feed met relevant nieuws in google spreadsheets te importeren. Maar voor de koppeling van rapportdata met rss-feeds op basis van datum of onderwerp heeft Google geen kant en klare oplossing. <br /><br />Ook bij Business Intelligence leveranciers kon ik nog geen commercieel rijpe oplossingen vinden. In het <a href="http://labs.businessobjects.com/">lab van Business Objects</a> staan wel 2 proefopstellingen:<br /><br /><a href="http://labs.businessobjects.com/data_feed/default.asp">Rss-feed as a universe</a> ontsluit een rss-feed via een Universe waardoor deze gegevens schijnbaar te combineren zijn met andere gegevens.<br /><a href="http://labs.businessobjects.com/bi_annotator/default.asp">BI Annotator</a> is een tool voor <a href="http://www.businessobjects.com/product/">BOXI</a> en combineert de ongestructureerde text uit een rss-feed met bv de dimensionele data uit een sterschema. Het wordt niet helemaal duidelijk of de tijdsdimensie hierbij een rol speelt.<br /><br />Eigenlijk moet je de rss-feeds met de andere data integreren in het datawarehouse en moet je dit niet willen oplossen met een BI-tool. Hoe je dit in het dwh moet modelleren is een vraagstuk op zich bv als aparte rss-dimensies of als onderdeel van een andere dimensie of als aparte ster met nieuwsfeiten. Misschien dat ik daar nog wat blogjes aan ga wijden.<br /><br />Integratie van rss-feeds in rapportages is dus volgens mij met de huidige BI-tools nog niet mogelijk. Misschien dat iemand anders nog wel een oplossing heeft gevonden?Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com3tag:blogger.com,1999:blog-35055721.post-74905890997179743642008-10-06T00:13:00.020+02:002008-10-06T13:41:48.396+02:00Timerime en andere interactieve tijdlijnen<object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" codebase="http://fpdownload.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=8,0,0,0" width="800" height="355" id="timerimeSWF" align="middle">
<br /><param name="allowScriptAccess" value="always" />
<br /><param name="movie" value="http://www.timerime.com/flash/timerimeSWF.swf?Qxml=12835&embedded=1" /><param name="quality" value="high" /><param name="wmode" value="transparent" /><param name="bgcolor" value="#ffffff" /><embed src="http://www.timerime.com/flash/timerimeSWF.swf?Qxml=12835&embedded=1" quality="high" wmode="transparent" bgcolor="#ffffff" width="800" height="355" name="timerimeSWF" align="middle" allowScriptAccess="always" type="application/x-shockwave-flash" pluginspage="http://www.macromedia.com/go/getflashplayer" />
<br /></object>
<br />
<br />Dankzij de jongens van <a href="http://www.timerime.com/">Timerime</a>, kun je ook zo'n prachtige <a href="http://www.google.com/tenthbirthday/#start">interactieve tijdlijn</a> bouwen die Google gebruikt om zijn 10-jarige geschiedenis te visualiseren.
<br />
<br />De Timerime website is een social media site voor historische gegevens waar communityleden informatie op een tijdlijn creëren, delen, publiceren en vergelijken. Frankwatching heeft <a href="http://www.frankwatching.com/archive/2008/07/25/site-gespot-timerimecom/">een interview met de Nederlandse bedenkers</a>. Ik heb me laten vertellen dat er voor timerime ook veel belangstelling is uit de educatieve hoek. daar kan ik me iets bij voorstellen. Ik heb zelf een <a href="http://www.worldhistory-poster.com/nl/over-dit-project/bronnen">world history poster</a>. Een interactieve versie in timerime zou het gevaarte een stuk handelbaarder maken.
<br />
<br />Business Objects heeft in zijn <a href="http://labs.businessobjects.com">labs</a> ook een interactieve tijdlijn met veel visueel geweld, <a href="http://labs.businessobjects.com/vizserver/default.asp">de timewall</a>, als onderdeel van vizserver. Als je zelf iets overzichterlijker tijdlijnen wilt bouwen of wilt demo-en dan kan dat ook met de <a href="http://jrochelle.googlepages.com/97g-timeline-about.html">timeline gadget voor Google spreadsheets</a>. Dit is weer een spinoff van het open source <a href="http://code.google.com/p/simile-widgets/wiki/Timeline">simile timeline project</a> van het MIT. Kijk ook eens naar <a href="http://simile.mit.edu/mediawiki/index.php?title=Special:ask&query=%0A++[[Category%3AExample+timeline]]%0A&sort=&order=ASC">de andere voorbeelden van simile</a>.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com1tag:blogger.com,1999:blog-35055721.post-87218308765660480132008-09-15T23:05:00.004+02:002008-09-15T23:40:23.608+02:00wordle visualisaties<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjCrmHwAcrN5kO3N-rh9V5dAWY_Yquh9VyBEDP2euuIWZGGI4KQVcffipq1RPiQT_X82LqJAsiKvyiPbeWDJKwHePPIHYjUSYsn8vpEmOPx7n3XVDuujYutrNqM3mktCxFROty-hw/s1600-h/wordle_databikkel_tags.png"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjCrmHwAcrN5kO3N-rh9V5dAWY_Yquh9VyBEDP2euuIWZGGI4KQVcffipq1RPiQT_X82LqJAsiKvyiPbeWDJKwHePPIHYjUSYsn8vpEmOPx7n3XVDuujYutrNqM3mktCxFROty-hw/s400/wordle_databikkel_tags.png" border="0" alt=""id="BLOGGER_PHOTO_ID_5246357543537517234" /></a><br />Via <a href="http://wordle.net/">wordle</a> genereer je van del.icio.us tags, vrije tekst of weblogs de prachtigste tagclouds. Mooiere tagclouds ben ik nog niet tegengekomen. Hier zie je de <a href="http://delicious.com/databikkel">del.icio.us tags van databikkel</a> en zie je aan de grootte van de woorden wat me bezighoudt.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-68265210145832963142008-09-08T00:03:00.018+02:002008-09-09T00:46:05.389+02:00Google Charts (api)<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgp-SprUQvzMAq7INklkXjfx1SfqNDcHtZaVSM5SvsrpCZm-OZHQW817deTBQ0CeP83fBOYqG2Zx2vhrK7kfpy0s6wrdo-950kWbE2smwGTTsKfTe3PN3O13rAuknjY1Gxxrq07Vg/s1600-h/twitter_google.jpg"><img style="float:left; margin:0 10px 10px 0;cursor:pointer; cursor:hand;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgp-SprUQvzMAq7INklkXjfx1SfqNDcHtZaVSM5SvsrpCZm-OZHQW817deTBQ0CeP83fBOYqG2Zx2vhrK7kfpy0s6wrdo-950kWbE2smwGTTsKfTe3PN3O13rAuknjY1Gxxrq07Vg/s320/twitter_google.jpg" border="0" alt=""id="BLOGGER_PHOTO_ID_5243778860624470242" /></a> Dit is een blog in een serie waarin ik probeer te ontdekken of Google geschikt is als BI-platform. Ik heb ze gelabeld als Gbi (Google bi).<br /><br />Een van de minder bekende api's van Google is de <a href="http://code.google.com/apis/chart/">Google Chart api</a>. Door simpelweg een url te maken met een aantal parameters, zoals type, kleur en labels en daarbij de waarden op te geven, tover je een statische grafiek in .png formaat in de browser. Hiermee kun je verrassend mooie en veelzijdige grafieken maken die zeker niet onderdoen voor de grafiekmogelijkheden van dure rapportagetools.<br /><br />De vraag is nu of je met Google Charts een Google business intelligence oplossing zou kunnen bouwen. Ik stel me daarbij voor dat je Igoogle wilt gebruiken als platform om rapporten te tonen. <br /><br />Met Google Graphs blijkt dat ronduit lastig te zijn. De resultaten van een query moet je via handgecodeerde scripts omzetten in de gewenste attributen met de bijbehorende resultaatsets. Voor de gemiddelde BI-er een stap te ver. Daarnaast zijn de grafieken statisch: tooltips en een drillthrough zijn niet mogelijk. Wat in dit geval ontbreekt is een laag die de <a href="http://groups.google.com/group/google-chart-api/browse_thread/thread/0abf7b6d95994979#">resultaten van een query eenvoudig omzet naar een grafiek</a> (met een tabel). En dan laat ik het afschermen van de sql in een semantische laag even buiten beschouwing. Via een <a href="http://googlesystem.blogspot.com/2007/12/using-google-gadgets-to-cache-images.html">lelijke hack</a> met de <a href="http://code.google.com/apis/gadgets/docs/reference.html">google gadgets api</a> kun je de plaatjes alsnog in <a href="http://www.edwords.nl/2007/05/01/igoogle-gepersonaliseerde-startpagina/">iGoogle</a> tonen.<br /><br />Maar als je je niet laat intimideren door code zijn er met deze api hele mooie grafieken te maken die het best tot hun recht komen in een mashup. Zie bv de combinatie van twitterstatistieken met yahoo pipes en google charts en de <a href="http://www.programmableweb.com/api/google-chart/mashups">andere voorbeelden op programmableweb</a>.<br /><br />Kortom een normale bi-er zal van Google Graphs niet blij worden. Gelukkig zijn er alternatieven zoals de <a href="http://code.google.com/apis/visualization/">visualization api</a>, maar daarover in een volgende post meer.<br /><br />Mocht je toch nieuwsgierig zijn geworden: Er zijn verschillende graph generatoren, waaronder <a href="http://charts.hohli.com/">het fraaie hohli</a>, om te spelen met de verschillende grafieken.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-53806412046704411282008-09-04T12:58:00.006+02:002008-09-05T01:31:12.552+02:00Google olap met pivot tables<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhicWAc-BU3npZ3hfp4M0JjftVRMPPopGY9GbwFK-NxtbFVtmVG6WTOFsO5IS1dqNQbOLLRWTFORHE4U_a0AJhg8lMAU4P9C2bBPCvGB0PKtAQmzhIxZ9XVMX3yLDXb7Fl4PTLOgQ/s1600-h/panormamapivot.png"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhicWAc-BU3npZ3hfp4M0JjftVRMPPopGY9GbwFK-NxtbFVtmVG6WTOFsO5IS1dqNQbOLLRWTFORHE4U_a0AJhg8lMAU4P9C2bBPCvGB0PKtAQmzhIxZ9XVMX3yLDXb7Fl4PTLOgQ/s320/panormamapivot.png" border="0" alt=""id="BLOGGER_PHOTO_ID_5242309644046031474" /></a><br /><br /><a href="http://www.panoramasoftware.com/">Panorama</a>, het bedrijf dat met <a href="http://en.wikipedia.org/wiki/Microsoft_Analysis_Services">de bouw van sql server olap services</a> een revolutie veroorzaakte in de business intelligence wereld is terug met een nieuw revolutionair BI tool: <a href="http://www.panorama.com/powerapps/index.html">Powerapps</a>.<br /><br />Powerapps is initieel ontwikkeld voor analytische oplossingen voor <a href="http://www.google.com/apps/">Google Apps</a>, maar het is de bedoeling dat de tool generieker ingezet gaat worden in een a Software as a Service model. <br /><br />Een gratis versie is beschikbaar als <a href="http://www.panorama.com/google/pivot-table/">panorama pivot table</a> in <a href="http://www.google.com/googlespreadsheets/try_out.html">Google spreadsheets</a>. Er zijn natuurlijk een aantal beperkingen. Zo kan het spreadsheet van Google maar 10.000 rijen aan en mag het 500k groot zijn. Dit is dus geen optie voor enterprise data oplossingen. <br /><br /><a href="http://www.panorama.com/news/events/archives/2008/google-webinar-sept-23.html"><br />23 september ia er een webinar van panorama en het google apps team</a> over de bi-oplossingen voor google apps. Waar wellicht wat meer duidelijk wordt over de mogelijkheden en toekomstige ontwikkelingen. <br /><br />Ik krijg 'm met mijn data niet aan de praat zodat ik geen voorbeeldsheet kan sharen, maar hier een tutorial video over hoe het zou moeten werken:<br /><br /><object width="425" height="344"><param name="movie" value="http://www.youtube.com/v/-pzhZuakwk4&hl=en&fs=1"></param><param name="allowFullScreen" value="true"></param><embed src="http://www.youtube.com/v/-pzhZuakwk4&hl=en&fs=1" type="application/x-shockwave-flash" allowfullscreen="true" width="425" height="344"></embed></object>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-36453528531418534312008-08-27T23:08:00.019+02:002008-09-05T01:32:03.085+02:00Trendanalyzer in iGoogle<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhDpNjowBsiM_50Pw8M41Sara6XvZMPYtgjNIhdbz96h2C_H3khLIfYALE_mp1hDuSZlLCUr-XgHrFD98CzIH8D4GKYOO9Pg7u_VvaiU78AizM57LEqUfEXLL9RHcdUri2A-Mh6jQ/s1600-h/motionchart.jpg"><img style="display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhDpNjowBsiM_50Pw8M41Sara6XvZMPYtgjNIhdbz96h2C_H3khLIfYALE_mp1hDuSZlLCUr-XgHrFD98CzIH8D4GKYOO9Pg7u_VvaiU78AizM57LEqUfEXLL9RHcdUri2A-Mh6jQ/s320/motionchart.jpg" border="0" alt=""id="BLOGGER_PHOTO_ID_5240764255368846050" /></a><br /><br />Een jaar geleden berichtte ik dat <a href="http://blog.databikkel.nl/2007/03/google-koopt-trendanalyzer.html">Google Trendanalyzer</a>, een <a href="http://www.gapminder.org/">tool van Gapminder</a> waarmee schitterende visualisaties zijn te maken, had gekocht. Google heeft het als gadget/plugin (de naam wisselt nog regelmatig) onder de naam Motion Chart beschikbaar gemaakt en niet zoals ik trachtte te voorspellen als standalone presentatie app.<br /><br />Hier zie je de Motion Chart in actie <a href="http://spreadsheets.google.com/pub?key=pCQbetd-CptE1ZQeQk8LoNw">in een voorbeeld van Google</a> zelf. (Ik heb nog gezocht naar leuke datasets op <a href="http://www.swivel.com/">swivel</a> en <a href="http://services.alphaworks.ibm.com/manyeyes/home">many eyes</a>, maar daar kon ik niet zo veel mee.)<br /><br />Naast Motion Chart zijn er nog een aantal andere fraaie visualisaties van Google en andere partijen zoals <a href="http://documents.google.com/support/spreadsheets/bin/answer.py?hl=en-uk&answer=91600">gauges</a> en <a href="http://documents.google.com/support/spreadsheets/bin/answer.py?answer=91599&query=heatmap&topic=&type=">heatmaps</a>. Want Google stelt ook derden via de <a href="http://code.google.com/apis/visualization/documentation/gadgetgallery.html">visualization api</a> in de gelegenheid om <a href="http://code.google.com/apis/spreadsheets/spreadsheet_gadgets.html">gadgets te maken voor spreadsheets</a>. <br /><br />Het mooie van die gadgets in Google spreadsheets is dat je ze kunt tonen in <a href="http://nl.wikipedia.org/wiki/Igoogle">iGoogle</a>. Op deze manier kun je heel simpel, eenvoudige dashboards bouwen. In de komende posts zal ik wat verder ingaan op de mogelijkheden om Google in te zetten als Business Intelligence tool.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-79268684093827164482008-08-26T23:35:00.005+02:002008-08-27T00:18:28.192+02:00Grarafieken<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEif5bTkg7TxIyLbHvQim2dfIexear7Ll5rbXcQn2sMnvTMvGv2MfE08Dp8dpW9kb9iOK76P8NIkMQXREqAA-p7UsjtDY6qdnwsvwThFACbD4Xw_kv9s3WYP7eiJxwc0ExXBU-NHZQ/s1600-h/song_memes.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEif5bTkg7TxIyLbHvQim2dfIexear7Ll5rbXcQn2sMnvTMvGv2MfE08Dp8dpW9kb9iOK76P8NIkMQXREqAA-p7UsjtDY6qdnwsvwThFACbD4Xw_kv9s3WYP7eiJxwc0ExXBU-NHZQ/s320/song_memes.jpg" alt="" id="BLOGGER_PHOTO_ID_5238953815126141570" border="0" /></a><br />Om mijn roestige schrijfspinsels na een jaar zonder bloggen weer wat los te krijgen eerst maar eens wat ongein.<br /><br />Zo zag ik dat <a href="http://www.8a.nl/blog/2008/08/01/kunst-met-grafieken/">Sipke</a> een kanaal op flickr had gevonden waar je <a href="http://www.flickr.com/photos/boyshapedbox/sets/72157603957925616/">songs die zijn uitgedrukt in een grafiek</a>, kunt raden. Grarafieken, bedacht ik spontaan. Leuk woord ook voor grafieken die niemand snapt<br /><br />Nog meer kantoorhunor vind je bij <a href="http://graphjam.com/">graphjam</a>. Goed, het haalt niet het nivo van the <a href="http://www.bright.nl/the-it-crowd">IT crowd</a> of <a href="http://www.dilbert.com/">Dilbert</a> maar er staan zeker erg grappige grafieken bij. Goed genoeg voor een slechte grap bij presentatie van de maandrapportages.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-60968923953568818572008-08-24T22:15:00.003+02:002008-08-25T15:26:48.461+02:00Een doorstart van databikkelZo, ik ben er even een jaar tussenuit geweest. Het was te hectisch om veel tijd aan bloggen te kunnen besteden. Ik ben namelijk zo verstandig geweest om de drie meest stressvolle dingen in het leven van een westerse man tegelijk te doen:<br /><br />Ik ben verhuisd, heb mijn baan opgezegd en ben voor mezelf begonnen en ik ben de gelukkige vader van een nu al weer 1 jarig meisje.<br /><br />Nu mijn leventje weer wat stabieler is, begint ook het bloggen weer te kriebelen. Ik zie zo veel leuke dingen passeren in mijn rssreader en in mijn nieuwe zakelijke leven als directeur van Besselse Business Intelligence & Datamanagement die ik te graag wil delen.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-84699094359403276662007-03-20T18:12:00.002+01:002008-12-11T09:17:50.399+01:00Datavisualisatie: Second Life versus Croquet<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhvF18OKh8rz3VV4Yyt8sejp_LJfZSyhcGfXGPVjlI9UX06OoYZErxiJZEl-B-Q3xGZKfqeqFnH4IiucVY5IydWSPXICXf5Mkjd78kUkjhDPpIA1P59tAbbtDkBX_NXhIrDs3gTRw/s1600-h/croquetsheet.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhvF18OKh8rz3VV4Yyt8sejp_LJfZSyhcGfXGPVjlI9UX06OoYZErxiJZEl-B-Q3xGZKfqeqFnH4IiucVY5IydWSPXICXf5Mkjd78kUkjhDPpIA1P59tAbbtDkBX_NXhIrDs3gTRw/s320/croquetsheet.jpg" alt="" id="BLOGGER_PHOTO_ID_5182099776054098002" border="0" /></a>3D-werelden als <a href="http://www.secondlife.nl/" mce_href="http://www.secondlife.nl/">Second Life</a> hebben een enorme potentie om informatie op een geheel nieuwe wijze te presenteren. De persconferentie van een jaarverslag in een 3D-wereld zou bijvoorbeeld gedaan kunnen worden als een virtuele rondleiding langs een aantal tentoongestelde grafieken. <p>Voor business intelligence biedt zo'n wereld ongekende mogelijkheden om data te visualiseren. Bijvoorbeeld door met data een landschap te ontwerpen waarin data-analisten vrij rond kunnen zwerven om allerlei verbanden te zoeken.</p> <p>Maar het is momenteel al een hele kunst om een <a href="http://www.oreilly.com/pub/h/5239" mce_href="http://www.oreilly.com/pub/h/5239">presentatie in second life</a> te geven met powerpoint. En de <a href="http://thisvirtuallife.blogspot.com/2006/10/future-of-internet-is-not-secondlife.html" mce_href="http://thisvirtuallife.blogspot.com/2006/10/future-of-internet-is-not-secondlife.html">scripttaal van second life</a> lijkt niet heel geschikt om echt spectaculaire data visualisaties te bouwen. Second life is gewoon niet gebouwd met dat doel voor ogen. Hoewel er hier en daar toch mooie data visualisaties zijn te vinden, zoals <a href="http://www.secondlifeinsider.com/2006/10/28/3d-weather-data-visualization-in-second-life/" mce_href="http://www.secondlifeinsider.com/2006/10/28/3d-weather-data-visualization-in-second-life/">realtime visualisatie van het weer</a> en dit <a href="http://eightbar.co.uk/2006/10/11/complex-system-modelling-in-second-life/" mce_href="http://eightbar.co.uk/2006/10/11/complex-system-modelling-in-second-life/">model om complexe informatie</a> weer te geven.</p> <p><a href="http://en.wikipedia.org/wiki/Croquet_project" mce_href="http://en.wikipedia.org/wiki/Croquet_project">Croquet</a> is een 3d-wereld die wel specifiek ontworpen is voor data visualisatie, virtueel leren en voor probleem oplossende omgevingen. Daarnaast is het niet opgezet als een groot monolithisch systeem als second life, maar als een verzameling losse werelden die eventueel aan elkaar te knopen zijn, waardoor die gegevens goed af te schermen zijn voor niet-bevoegden.</p> <p>Bovendien is <a href="http://www.opencroquet.org/index.php/Main_Page" mce_href="http://www.opencroquet.org/index.php/Main_Page">Croquet open source</a> en gebouwd met <a href="http://www.squeak.org/" mce_href="http://www.squeak.org/">squeak</a>, een smalltalk implementatie. En die omgeving lijkt wel krachtig genoeg om - over niet al te lange tijd - prachtige datalandschappen te ontwerpen als virtueel bi-landschap-architect.</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-84027860764876897462007-03-19T17:07:00.001+01:002008-12-11T09:17:50.601+01:00Google koopt Trendanalyzer<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhysAqunQV7aul9JmfBP2cIT6ZVZKBGsZKJ3unrB0uRaXY1oOnTX2cT8F87OqtrUuRQhRxOYbXRR9Ow2XDYgYCP5rGWkA98f-4IiqKnKZZ81KfxPkw5yz8iaHwmrdTtwR9i2DpTNQ/s1600-h/aBetterPlace.jpg"><img style="margin: 0pt 10px 10px 0pt; float: left; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhysAqunQV7aul9JmfBP2cIT6ZVZKBGsZKJ3unrB0uRaXY1oOnTX2cT8F87OqtrUuRQhRxOYbXRR9Ow2XDYgYCP5rGWkA98f-4IiqKnKZZ81KfxPkw5yz8iaHwmrdTtwR9i2DpTNQ/s320/aBetterPlace.jpg" alt="" id="BLOGGER_PHOTO_ID_5182082995616872514" border="0" /></a>Google's doel om 's werelds informatie te ontsluiten en universeel beschikbaar en bruikbaar te maken, is weer een stapje dichterbij door <a href="http://googleblog.blogspot.com/2007/03/world-in-motion.html" mce_href="http://googleblog.blogspot.com/2007/03/world-in-motion.html">de aanschaf van Trendanalyzer</a>, het datavisualisatie tool van de <a href="http://www.gapminder.org/" mce_href="http://www.gapminder.org/">Gapminder foundation</a>. <p>In het <a href="http://docs.google.com/" mce_href="http://docs.google.com/">officepakket van google</a> ontbreekt nog een presentatietool en een aangepaste <a href="http://tools.google.com/gapminder/" mce_href="http://tools.google.com/gapminder/">versie van trendanalyze</a>r zou daar uitstekend geschikt voor zijn. Of zijn het Google's eerste voorzichtige schreden in BI-land?</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-27487798615323458602007-03-13T16:49:00.001+01:002008-12-11T09:17:50.821+01:00Swift en de privacy van eu-burgers<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhhAQHUdUbmj3oHqImE6OMjGtjIva7dUIKqKzULxtHerOLm_KsNn3dEfRuP1Ma5S_DUcXBvd4Oj4NNaCFmaBQbHcBJlD7ZxQu4b3mBVn67VTO9vqX1zNVVNslTiDtmpY4Zb1xqylA/s1600-h/swift.jpg"><img style="margin: 0pt 10px 10px 0pt; float: left; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhhAQHUdUbmj3oHqImE6OMjGtjIva7dUIKqKzULxtHerOLm_KsNn3dEfRuP1Ma5S_DUcXBvd4Oj4NNaCFmaBQbHcBJlD7ZxQu4b3mBVn67VTO9vqX1zNVVNslTiDtmpY4Zb1xqylA/s320/swift.jpg" alt="" id="BLOGGER_PHOTO_ID_5182082540350339122" border="0" /></a>NRC Handelsblad vraagt zich, <a href="http://www.nrc.nl/economie/article654464.ece/CIA_kijkt_via_achterdeur_mee_bij_banken" mce_href="http://www.nrc.nl/economie/article654464.ece/CIA_kijkt_via_achterdeur_mee_bij_banken">vanwege de swift-zaak</a>, af hoe groot de greep van de Amerikaanse overheid is op privacy gevoelige data van Europese burgers. Hieronder een overzicht van deze case. <p><a href="http://www.swift.com/index.cfm?item_id=1001" mce_href="http://www.swift.com/index.cfm?item_id=1001">Swift</a> is een Belgische organisatie die in het geniep maar met medeweten van de Europese Centrale Bank <a href="http://tweakers.net/nieuws/43157/CIA-monitort-centrale-databank-internationaal-geldverkeer.html" mce_href="http://tweakers.net/nieuws/43157/CIA-monitort-centrale-databank-internationaal-geldverkeer.html">financiële gegevens van o.a. eu burgers doorspeelde</a> naar het Amerikaanse ministerie van financiën om financiële sporen van terroristen op te sporen.</p> <p>De New York Times onthulde deze privacyschending van Europese burgers vorig jaar juni en de Europese commissie zou een <a href="http://tweakers.net/nieuws/45334/Amerikanen-verliezen-toegang-tot-bancaire-verkeersdata.html" mce_href="http://tweakers.net/nieuws/45334/Amerikanen-verliezen-toegang-tot-bancaire-verkeersdata.html">einde maken aan de toegang van de amerikanen tot het swiftsysteem</a>.</p> <p>Maar volgens <a href="http://www.nrc.nl/economie/article654464.ece/CIA_kijkt_via_achterdeur_mee_bij_banken" mce_href="http://www.nrc.nl/economie/article654464.ece/CIA_kijkt_via_achterdeur_mee_bij_banken">de NRC</a> hebben de Amerikanen nog steeds toegang tot onze gegevens. Volgens tweakers zijn de bancaire transacties toegankelijk omdat <a href="http://tweakers.net/nieuws/46365/Swift-datacentrum-in-VS-in-strijd-met-Europese-belangen.html" mce_href="http://tweakers.net/nieuws/46365/Swift-datacentrum-in-VS-in-strijd-met-Europese-belangen.html">het datacentrum van Swift in de VS staat</a> en daardoor onder de Amerikaanse wet valt. Op de swift-site legt <a href="http://www.swift.com/index.cfm?item_id=61228#section4" mce_href="http://www.swift.com/index.cfm?item_id=61228#section4">Swift haar rol in deze zaak</a> uit.</p> <p>Deze zaak is in mijn ogen een sprekend voorbeeld van hoe Europa afglijdt naar een <a href="http://www.cbpweb.nl/downloads_overig/NE_Surveillance_Soc_Summary.pdf" mce_href="http://www.cbpweb.nl/downloads_overig/NE_Surveillance_Soc_Summary.pdf">bewakingsstaat</a>. Ik vraag me daarom wel eens af in hoeverre IT-ers en in het bijzonder data warehouse specialisten zich ervan bewust zijn in hoeverre ze daar aan meewerken.</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-55398542824663800652007-03-12T16:46:00.002+01:002008-12-11T09:17:50.969+01:00Nationaal datawarehouse<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg_z7Vabu8tHfVEfrXdetBqIcMPdLkSXICW3E2g8HNWIKGlkFAVB-5MHwg1tbmcCKtglfky1wVNObcfkgSmzcr6eRRuxnzyI_L7oqHC_L9TwF0EZRr3xci2g9oeUpCzSMabYF7LEA/s1600-h/ndw2.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg_z7Vabu8tHfVEfrXdetBqIcMPdLkSXICW3E2g8HNWIKGlkFAVB-5MHwg1tbmcCKtglfky1wVNObcfkgSmzcr6eRRuxnzyI_L7oqHC_L9TwF0EZRr3xci2g9oeUpCzSMabYF7LEA/s320/ndw2.jpg" alt="" id="BLOGGER_PHOTO_ID_5182077588253046818" border="0" /></a>Opvallend genoeg heeft vorige week het <a href="http://blog.databikkel.nl/wordpress/wp-admin/www.nationaaldatawarehouse.nl" mce_href="http://blog.databikkel.nl/wordpress/wp-admin/www.nationaaldatawarehouse.nl">nationaal datawarehouse</a> de <a href="http://news.google.nl/news?hl=nl&ned=&q=nationaal+datawarehouse&btnG=Nieuws+zoeken" mce_href="http://news.google.nl/news?hl=nl&ned=&q=nationaal+datawarehouse&btnG=Nieuws+zoeken">Nederlandse pers</a> gehaald. Rtl4 had zelfs een <a href="javascript:void(0)" mce_href="javascript:void(0)">filmpje over het NDW</a>. En dat voor een data warehouse dat nog gebouwd moet worden want de aanbesteding gaat van de zomer van start. <p>Het doel van het ndw is de filedruk te verminderen door gegevens te verzamelen en te publiceren over de infrastructuur en het actuele verkeer. Momenteel is de verkeersinformatie niet actueel en volledig omdat de gegevens uit de vele verkeerssystemen niet goed op elkaar zijn afgestemd.</p> <p>Gedetailleerde informatie over o.a de architectuur en de <a href="http://www.google.nl/url?sa=t&ct=res&cd=8&url=http%3A%2F%2Fnm-magazine.nl%2Fuploads%2Fmedia%2FNationaalDataWarehouseDVMcongres-speechmennoolman.ppt&ei=ZY70RfzSGaC20QSruoVj&usg=__qgebXAuFV66j9CU4Qes3Ed8wd4Q=&sig2=7-MB1OtBa2mW8JzfWkJZog" mce_href="http://www.google.nl/url?sa=t&ct=res&cd=8&url=http%3A%2F%2Fnm-magazine.nl%2Fuploads%2Fmedia%2FNationaalDataWarehouseDVMcongres-speechmennoolman.ppt&ei=ZY70RfzSGaC20QSruoVj&usg=__qgebXAuFV66j9CU4Qes3Ed8wd4Q=&sig2=7-MB1OtBa2mW8JzfWkJZog">visie van het nationaal data warehouse</a> is <a href="http://www.google.nl/url?sa=t&ct=res&cd=8&url=http%3A%2F%2Fnm-magazine.nl%2Fuploads%2Fmedia%2FNationaalDataWarehouseDVMcongres-speechmennoolman.ppt&ei=ZY70RfzSGaC20QSruoVj&usg=__qgebXAuFV66j9CU4Qes3Ed8wd4Q=&sig2=7-MB1OtBa2mW8JzfWkJZog" mce_href="http://www.google.nl/url?sa=t&ct=res&cd=8&url=http%3A%2F%2Fnm-magazine.nl%2Fuploads%2Fmedia%2FNationaalDataWarehouseDVMcongres-speechmennoolman.ppt&ei=ZY70RfzSGaC20QSruoVj&usg=__qgebXAuFV66j9CU4Qes3Ed8wd4Q=&sig2=7-MB1OtBa2mW8JzfWkJZog">hier</a> te vinden.</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-48494291901550312802007-02-23T16:41:00.001+01:002008-12-11T09:17:51.185+01:00Data mashups platformen voor bi<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhe8TKI7R8Yy9McPoReuRV0Rgt-kAEWJHNNdHvoYx2cXtTQykGGgpzuiCH-4i-UjcL5iq3U0orlCLZlILtDZYzyA4p6HnbDVLuU2zw-Zv6bEUiptOYJjhWjXibOd5kh52ZHP7uDdw/s1600-h/denodo.jpg"><img style="margin: 0pt 10px 10px 0pt; float: left; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhe8TKI7R8Yy9McPoReuRV0Rgt-kAEWJHNNdHvoYx2cXtTQykGGgpzuiCH-4i-UjcL5iq3U0orlCLZlILtDZYzyA4p6HnbDVLuU2zw-Zv6bEUiptOYJjhWjXibOd5kh52ZHP7uDdw/s320/denodo.jpg" alt="" id="BLOGGER_PHOTO_ID_5182076986957625362" border="0" /></a>Getriggerd door mijn <a href="http://blog.databikkel.nl/2007/02/21/bi-20-mashups/" mce_href="http://blog.databikkel.nl/2007/02/21/bi-20-mashups/">eigen post over mashups</a>, heb ik nog verder gesnuffeld naar enterprise web 2.0 voorbeelden van mashups. Ik heb 2 voorbeelden gevonden: Oracle en Denodo. <p>Nu blijkt Oracle pas <a href="http://searchoracle.techtarget.com/originalContent/0,289142,sid41_gci1243290,00.html" mce_href="http://searchoracle.techtarget.com/originalContent/0,289142,sid41_gci1243290,00.html">Webcenter suite geïntroduceerd</a> te hebben. Dat is een toolset is om data uit applicaties met web 2.0 technieken - inclusief mashups- te integreren en om users te laten collaboreren via wiki's en weblogs. De user interface die met webcenter is te bouwen wordt hier gedemo-ed. Het <a href="http://www.enterpriseweb2.com/?p=147" mce_href="http://www.enterpriseweb2.com/?p=147">enterprise web 2.0 blog</a> is er overigens niet zo over te spreken.</p> <p><a href="http://www.denodo.com/english/index.html" mce_href="http://www.denodo.com/english/index.html">Denodo</a> is een Spaans bedrijf dat zich geheel richt op 'data mashups voor the enterprise'. De <a href="http://www.denodo.com/english/products.html" mce_href="http://www.denodo.com/english/products.html">denodo data mashup architectuur</a> integreert gestructureerde data uit bedrijfsapplicaties met ongestuctureerde data van het web of uit interne bronnen. De mashup is de plek waar die data samenkomt. De kracht van Denodo zit ook gedeeltelijk in een techniek om die ongestructureerde data te clusteren en/of samen te vatten. Denodo heeft <a href="http://www.denodo.com/english/seminars/competitive_bi_risk_management/index.php" mce_href="http://www.denodo.com/english/seminars/competitive_bi_risk_management/index.php">2</a> <a href="http://www.denodo.com/english/seminars/enterprise_data_mashups_ENE_07/index.php" mce_href="http://www.denodo.com/english/seminars/enterprise_data_mashups_ENE_07/index.php">webinar</a>s en <a href="http://www.denodo.com/english/seminars/miniwebinar_mashups/index.html" mce_href="http://www.denodo.com/english/seminars/miniwebinar_mashups/index.html">interview</a> over het platform online staan.</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-34090969510325998242007-02-21T16:37:00.001+01:002008-12-11T09:17:51.302+01:00BI 2.0: mashups<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9A6BTZ5Kf4jLn50tIjvZN62usZIKoWHnDfB4E7dxb6XouN5dxNEkaRorBJCzvXYxO-FwU802ieUy2cANhAcUvHFIviuXVWRUyyDOJTjniXTuvT5ul_ZctX3Tu3fO8U5j2WJ-gRA/s1600-h/tn_Google_Dashboard.png"><img style="margin: 0pt 10px 10px 0pt; float: left; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9A6BTZ5Kf4jLn50tIjvZN62usZIKoWHnDfB4E7dxb6XouN5dxNEkaRorBJCzvXYxO-FwU802ieUy2cANhAcUvHFIviuXVWRUyyDOJTjniXTuvT5ul_ZctX3Tu3fO8U5j2WJ-gRA/s320/tn_Google_Dashboard.png" alt="" id="BLOGGER_PHOTO_ID_5182075509488875522" border="0" /></a>BI 2.0, niemand weet nog precies waarvoor het staat maar het kan te maken te hebben met ajax, realtime bi, operational bi, web 2.0, enterprise search, soa's of on demand of al deze begrippen. <a href="http://enterprisebusinessintelligence.blogspot.com/2007/02/artikel-over-bi-20-in-database-magazine.html" mce_href="http://enterprisebusinessintelligence.blogspot.com/2007/02/artikel-over-bi-20-in-database-magazine.html">Erik Fransen</a> verzamelt voor dbm ideeën voor een artikel over BI 2.0. <p>Hier wil ik ingaan op de <a href="http://en.wikipedia.org/wiki/Web_2" mce_href="http://en.wikipedia.org/wiki/Web_2">web 2.0</a> component van BI 2.0 en dan speciaal <a href="http://en.wikipedia.org/wiki/Mashup_%28web_application_hybrid%29" mce_href="http://en.wikipedia.org/wiki/Mashup_(web_application_hybrid)">mashups</a>. Want een <a href="http://en.wikipedia.org/wiki/Mashup_%28web_application_hybrid%29" mce_href="http://en.wikipedia.org/wiki/Mashup_%28web_application_hybrid%29">mashup wordt in de wikipedia</a> gedefinieerd als een website of applicatie die data uit verschillende bronnen combineert tot 'een nieuwe ervaring'. En dat riekt verdacht veel naar BI.<br /><a href="http://en.wikipedia.org/wiki/Web_2" mce_href="http://en.wikipedia.org/wiki/Web_2"><br /></a><a href="http://www.programmableweb.com/url/5604" mce_href="http://www.programmableweb.com/url/5604"> Pentaho</a> is een voorbeeld van een BI tool waarmee een mashup is te maken met Googlemaps. Ook Business Objects heeft een mashuptool in de vorm van <a href="http://labs.businessobjects.com/mashup/default.asp" mce_href="http://labs.businessobjects.com/mashup/default.asp">graphicsmasher</a> maar die is alleen nog maar te bewonderen in het <a href="http://labs.businessobjects.com/" mce_href="http://labs.businessobjects.com/">lab</a>.</p> <p>Het maken van mashups is <a href="http://www.hackszine.com/blog/archive/2007/02/simple_zip_code_geocoding.html?CMP=OTC-7G2N43923558" mce_href="http://www.hackszine.com/blog/archive/2007/02/simple_zip_code_geocoding.html?CMP=OTC-7G2N43923558">redelijk ingewikkeld</a>, maar er komt een nieuwe klasse van tools aan waarmee dit een eitje wordt. In <a href="http://blogs.zdnet.com/BTL/?p=4491" mce_href="http://blogs.zdnet.com/BTL/?p=4491">SOA for the masses</a> geven Dan Farber en Larry Digna een uitstekend overzicht van deze tools. De meest revolutionaire zijn <a href="http://fastforwardblog.com/2007/02/15/teqlo-do-it-yourself-enterprise-20-mashups/" mce_href="http://fastforwardblog.com/2007/02/15/teqlo-do-it-yourself-enterprise-20-mashups/">Teqlo</a> en het net geïntroduceerde <a href="http://pipes.yahoo.com/" mce_href="http://pipes.yahoo.com/">Yahoo Pipes</a>.</p> De uitdaging voor BI-consultants en leveranciers is om die tools voor het maken van mashups ter beschikking te stellen aan de bi-eindgebruikers en wel op zo'n manier dat die mashups beheerbaar blijven. Want dat is met Excel, het <a href="http://www.businessweek.com/@@76IH*ocQ34AvyQMA/magazine/content/05_30/b3944108_mz063.htm" mce_href="http://www.businessweek.com/@@76IH*ocQ34AvyQMA/magazine/content/05_30/b3944108_mz063.htm">mix, mash en mutate</a> tool van het client/server tijdperk niet echt gelukt.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com1tag:blogger.com,1999:blog-35055721.post-64509478311286260612007-02-15T23:53:00.000+01:002008-12-11T09:17:51.498+01:00Realtime burger intelligence (bi)<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjhd-d-c8BPYfzFG1PiFNeArW7jsrh40tdXI7MkGHTGDFgNMOaVNeRLkkm6-XigWtT__KK62vrbNpH6yTbtgCyVe8UfdISen6N2Afr1EmNipVsEpIYNNowR3XhqNj86TlxcsMJ4fA/s1600-h/nomos.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjhd-d-c8BPYfzFG1PiFNeArW7jsrh40tdXI7MkGHTGDFgNMOaVNeRLkkm6-XigWtT__KK62vrbNpH6yTbtgCyVe8UfdISen6N2Afr1EmNipVsEpIYNNowR3XhqNj86TlxcsMJ4fA/s320/nomos.jpg" alt="" id="BLOGGER_PHOTO_ID_5166231692038165314" border="0" /></a><br /><p><a href="http://194.229.29.150/nomos/main.mxml?versionChecked=true" mce_href="http://194.229.29.150/nomos/main.mxml?versionChecked=true">Nomos</a> lijkt bijna het ideale dashboard te benaderen. Het dashboard is zo intuïtief dat iedere leek snel door heeft waarover de site gaat. En het is niet eens gebouwd door een bi-ontwikkelaar maar door een webdesignbureau.</p> <p>Nomos is een vorm van burger intelligence en is een dashboard met 1 meetwaarde, namelijk geluidshinder. De site visualiseert de geluidsmetingen rondom Schiphol. De geluidshinder is per baan, per postcode, per vliegtuig en per meetpost te bekijken en bevat zowel realtime als historische gegevens.</p> <p>Ter vergelijking is er ook de site <a href="http://www.geluidsnet.nl/" target="_blank" mce_href="http://www.geluidsnet.nl/">Geluidsnet,</a> die ook realtime en historische geluidsgegevens vertoont. Absoluut een mooie weergave van de geluidshinder, maar veel minder intuïtief.</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-18827294186468397792007-02-12T23:50:00.000+01:002008-12-11T09:17:51.633+01:00Enron explorer<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh6ZxN3InMsOSkQjtXbUkhlSEw_eZchxovLOTgMyPNFIyONrjRHbDEmJi7J8BQ1tFWKZzjLD_0QXELGk8T6ALlNkN6h95fLBt_DrYxNeaQDY17jRCRFP3HNXi9JD0SYHVGwncOo2w/s1600-h/enron.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh6ZxN3InMsOSkQjtXbUkhlSEw_eZchxovLOTgMyPNFIyONrjRHbDEmJi7J8BQ1tFWKZzjLD_0QXELGk8T6ALlNkN6h95fLBt_DrYxNeaQDY17jRCRFP3HNXi9JD0SYHVGwncOo2w/s320/enron.jpg" alt="" id="BLOGGER_PHOTO_ID_5166230266109023010" border="0" /></a><br /><p><a href="http://www.trampolinesystems.com/" mce_href="http://www.trampolinesystems.com/">Trampoline Systems</a> heeft een <a href="http://www.trampolinesystems.com/products/sonar-platform-social-networks-and-relevance/" mce_href="http://www.trampolinesystems.com/products/sonar-platform-social-networks-and-relevance/">'interessant' product</a>, waarmee je sociale netwerken, expertise en informatiestromen in kaart brengt binnen een bedrijf. De gemiddelde werknemer zit er ongetwijfeld niet op te wachten dat zijn mail wordt afgetapt.</p> Maar die enorme berg ongestructureerde data uit email, levert - eenmaal gestructureerd - zeer waardevolle informatie op over een bedrijf. Dat wordt geweldig gedemonstreerd aan de hand van de nu <a href="http://enron.trampolinesystems.com/focus/19185" mce_href="http://enron.trampolinesystems.com/focus/19185">openbare mailwisseling binnen de Enron top. </a>Deze is te rangschkken naar onderwerp en persoon. Bovendien is te zien <a href="http://www.trampolinesystems.com/enron-explorer/" mce_href="http://www.trampolinesystems.com/enron-explorer/">wie met wie communiceerde</a>.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-65448837092854370882007-02-05T23:40:00.000+01:002008-12-11T09:17:51.803+01:00Een puzzel of een mysterie aanpak<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1TGuxvuS7Pr2jM2pPtJ4yWiGwZKv9U8pngqk6ielXvBjISIoPP3DK-BUEz1a8MCbIb0QfuVXuD9rZesckRi9ehNY4djeNCgxSg5LgV80P34tVgfa4PMwzgn1f5hQrZrsi9biEDg/s1600-h/data-management-puzzle.jpeg"><img style="margin: 0pt 10px 10px 0pt; float: left; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1TGuxvuS7Pr2jM2pPtJ4yWiGwZKv9U8pngqk6ielXvBjISIoPP3DK-BUEz1a8MCbIb0QfuVXuD9rZesckRi9ehNY4djeNCgxSg5LgV80P34tVgfa4PMwzgn1f5hQrZrsi9biEDg/s320/data-management-puzzle.jpeg" alt="" id="BLOGGER_PHOTO_ID_5166227869517271826" border="0" /></a>Malcom Gladwell (van <a href="http://www.gladwell.com/blink/" mce_href="http://www.gladwell.com/blink/">Blink</a> en de <a href="http://www.gladwell.com/tippingpoint/index.html" mce_href="http://www.gladwell.com/tippingpoint/index.html">Tipping Point</a>) schrijft in de New Yorker over een leuk nieuw inzicht, afkomstig van intelligence expert Gregory Treverton: <a href="http://www.newyorker.com/printables/fact/070108fa_fact" mce_href="http://www.newyorker.com/printables/fact/070108fa_fact">Het verschil tussen puzzels en mysteries.</a> <blockquote> <p class="descender"><i>"Osama bin Laden’s whereabouts are a puzzle. We can’t find him because we don’t have enough information. The key to the puzzle will probably come from someone close to bin Laden, and until we can find that source bin Laden will remain at large."</i></p> <p><i>"The problem of what would happen in Iraq after the toppling of Saddam Hussein was, by contrast, a mystery. It wasn’t a question that had a simple, factual answer. Mysteries require judgments and the assessment of uncertainty, and the hard part is not that we have too little information but that we have too much."</i></p></blockquote> <p>Gladwell beschrijft aan de hand van de van het Enron-schandaal en een verhaal over het geheime superwapen van de nazi's dat een intelligence probleem niet perse opgelost moet worden als een puzzel dwz door meer informatie te verzamelen. Een mysterie-insteek bleek in bovenstaande gevallen succesvoller.</p> <p><a href="http://www.kaushik.net/avinash/2007/01/web-analytics-a-puzzle-or-a-mystery.html" mce_href="http://www.kaushik.net/avinash/2007/01/web-analytics-a-puzzle-or-a-mystery.html">Avinash</a> en de <a href="http://www.juiceanalytics.com/weblog/?p=288" mce_href="http://www.juiceanalytics.com/weblog/?p=288">jongens van Juice Analytics</a> hebben de knuppel in het hoenderhok gegooid. Ze vragen zich of we Business Intelligence of web analytics vraagstukken wel als een puzzle moeten oplossen door bv zo veel mogelijk data te verzamelen over klanten. Zou een mysterie-achtige aanpak niet beter werken?</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-49813441247143624802007-02-05T23:32:00.000+01:002008-12-11T09:17:51.952+01:00Search in BI<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh4lujwNxwHwpjDpuZ_ek5zM9dONCrPA0PUfF7aybAKwGJoCGbrEA3l6V5gC_epYrZ6BzH2-gP5fqb2SPVzq2XWIgmGCNQB7bsWkoH5alsGxvNHWR1D7REjaHvllZfc0L174v6gNA/s1600-h/ijsberg.jpg"><img style="margin: 0pt 10px 10px 0pt; float: left; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh4lujwNxwHwpjDpuZ_ek5zM9dONCrPA0PUfF7aybAKwGJoCGbrEA3l6V5gC_epYrZ6BzH2-gP5fqb2SPVzq2XWIgmGCNQB7bsWkoH5alsGxvNHWR1D7REjaHvllZfc0L174v6gNA/s320/ijsberg.jpg" alt="" id="BLOGGER_PHOTO_ID_5166226606796886786" border="0" /></a>Zijn de BI-spelers voorzichtig wat zoekmogelijkheden in hun oplossingen aan het verwerken. De search spelers pakken het drastische aan en bieden search als BI oplossing aan. Zo introduceren 2 leiders van Gartners 'Information Access Magic Quadrant', een naar eigen zeggen, fundamenteel andere manier om BI te bedrijven. <p><a href="http://www.fastsearch.com/" mce_href="http://www.fastsearch.com/">Fast</a> <a href="http://home.businesswire.com/portal/site/google/index.jsp?ndmViewId=news_view&newsId=20070129005441&newsLang=en" mce_href="http://home.businesswire.com/portal/site/google/index.jsp?ndmViewId=news_view&newsId=20070129005441&newsLang=en">introduceert het Adaptive Information Warehouse (AIW)</a> dat bestaat uit een data cleansing tool en een data analyse tool, radar, genaamd. Computerworld laat een aantal analisten aan het woord over <a href="http://www.computerworld.com/action/article.do?command=viewArticleBasic&articleId=9009658" mce_href="http://www.computerworld.com/action/article.do?command=viewArticleBasic&articleId=9009658"> AIW.</a></p> <p>De onderliggende techniek noemen ze bij Fast <a href="http://www.fastsearch.com/l3a.aspx?m=551&amid=4197" mce_href="http://www.fastsearch.com/l3a.aspx?m=551&amid=4197">de Pyramid server</a>, dat wordt gepresenteerd als een alternatief voor kubussen. Zo op het eerste gezicht komt het op mij over, alsof ze BI-software hebben ontwikkeld ipv dat ze hun zoekmachine hebben ingezet voor een BI-oplossing.<br /><a href="http://www.autonomy.com/content/News/Releases/2007/0125.en.html" mce_href="http://www.autonomy.com/content/News/Releases/2007/0125.en.html">Het meaning analytics warehouse</a> van <a href="http://www.autonomy.com/content/home/index.en.html" mce_href="http://www.autonomy.com/content/home/index.en.html">Autonomy</a> lijkt spectaculairder. Dat is een module die informatie uit video, email, database etc indexeert, transformeert en analyseert obv betekenis en relaties. Meer informatie is er nog niet over te vinden.</p>Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-88768724857845249072007-02-02T23:28:00.000+01:002008-02-12T23:31:26.267+01:00(G)een theoretische grondslag voor BI<p><a href="http://www.bireview.com/authors.cfm?authorid=11" mce_href="http://www.bireview.com/authors.cfm?authorid=11">Neil Raden</a> <a href="http://www.bireview.com/article.cfm?articleid=288" mce_href="http://www.bireview.com/article.cfm?articleid=288">beweert in BI Review</a> dat de huidige BI tools niet zijn gebaseerd op <a href="http://nl.wikipedia.org/wiki/Herbert_Simon" mce_href="http://nl.wikipedia.org/wiki/Herbert_Simon">Herbert Simon's</a> <a href="http://nl.wikipedia.org/wiki/Besluitvormingstheorie" mce_href="http://nl.wikipedia.org/wiki/Besluitvormingstheorie">theorie van besluitvorming</a>:</p> <blockquote><p><i>"It is work of choosing issues that require attention, setting goals, finding or designing suitable courses of action, and evaluating and choosing among alternative actions. The first three of these activities - fixing agendas, setting goals and designing actions - are usually called problem solving; the last, evaluating and choosing, is usually called decision-making." </i></p></blockquote> <p>Volgens Raden is de assumptie in de BI-wereld dat data leidt naar de beslisfase en dat de probleemfase kan worden overgeslagen.</p> <p>Mijns inziens valt dat wel mee. Een beetje BI-consultant zal beweren dat BI niet draait om de tooling maar om het inrichten van de <a href="http://www.google.nl/search?sourceid=navclient-ff&ie=UTF-8&rls=GGGL,GGGL:2006-26,GGGL:nl&q=plan+do+check+act+business+intelligence" mce_href="http://www.google.nl/search?sourceid=navclient-ff&ie=UTF-8&rls=GGGL,GGGL:2006-26,GGGL:nl&q=plan+do+check+act+business+intelligence">plan-do-check-act cyclus</a> van <a href="http://en.wikipedia.org/wiki/W._Edwards_Deming" mce_href="http://en.wikipedia.org/wiki/W._Edwards_Deming">Deming</a>, waar ook een probleemfase in is te vinden. Daarnaast zou je kunnen zeggen dat Business Performance Management, het 'strategische zusje van BI', de probleemfase ondersteunt met <a href="http://www.12manage.com/methods_strategy_maps_strategic_communication_nl.html" mce_href="http://www.12manage.com/methods_strategy_maps_strategic_communication_nl.html">strategiemappen</a> en <a href="http://management.about.com/cs/generalmanagement/a/keyperfindic.htm" mce_href="http://management.about.com/cs/generalmanagement/a/keyperfindic.htm">kritische perfomance indicatoren</a>.</p> Bovendien denk ik dat BI tools juist tekort schieten in de besluitvormingsfase. Er is namlijk geen enkele BI tool dat potentiele alternatieve beslissingen of de gevolgen van bepaalde handelswijzen kan doorrekenen en dus het probleem van de <a href="http://en.wikipedia.org/wiki/Bounded_rationality" mce_href="http://en.wikipedia.org/wiki/Bounded_rationality">beperkte rationele keuzes</a> oplost.Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0tag:blogger.com,1999:blog-35055721.post-44268274920296464162007-01-30T01:26:00.000+01:002008-01-29T00:14:08.160+01:00Collectieve intelligentie met Many Eyes <a style="margin: 0pt; padding: 0pt" href="http://services.alphaworks.ibm.com/manyeyes/view/S2fqLEsOtha6QIEzkheOE2-"><br /><img style="border-style: solid solid none; border-color: rgb(175, 117, 93) rgb(175, 117, 93) -moz-use-text-color; border-width: 1px 1px 0pt; margin: 0pt; padding: 0pt" id="$ManyEyesThumbnail" src="http://services.alphaworks.ibm.com/manyeyes/static-resources/snapshot/89ade5ae105f6ac401106aab70fd051c.jpeg" /><br /><img id="Any_10" style="border: 0pt none ; margin: 0pt; padding: 0pt; display: block; position: relative; top: -5px" src="http://services.alphaworks.ibm.com/manyeyes/images2/blog_this_caption.jpg" /><br /></a><br /><br />Naast <a href="http://www.swivel.com/">Swivel</a> en <a href="http://data360.org/index.aspx">Data360</a> is er nu een derde platform om datasets via internet te delen en te visualiseren: <a href="http://services.alphaworks.ibm.com/manyeyes/home">Many Eyes</a> van het <a href="http://www.research.ibm.com/visual/">visual Communication Lab van IBM.</a><br /><blockquote><em><span class="lotsOfText">"Many Eyes is a bet on the power of human visual intelligence to find patterns. Our goal is to "democratize" visualization and to enable a new social kind of data analysis."</span></em></blockquote><br />Het idee is dat door data te delen en te bediscussiëren er nieuwe inzichten zullen ontstaan. Een sterk punt tov de andere social data sites is de interactiviteit van de grafieken. Bovendien leggen de makers goed uit <a href="http://services.alphaworks.ibm.com/manyeyes/page/Visualization_Options.html">wanneer je welke grafiek moet gebruiken</a>.<br /><br /><!--adsense-->Albert Besselsehttp://www.blogger.com/profile/13588091267385841757noreply@blogger.com0