Computerworld News Service: Det stadigt voksende antal ikke-relationelle databaser (NoSQL), kræver standardisering for at nå deres fulde potentiale.
Det skriver to researchere fra Microsoft i den seneste udgave af Association for Computing Machinerys flagskibs-publikation, Communications.
Det spæde NoSQL-marked er ekstremt fragmenteret med mange konkurrerende leverandører og teknologier.
Programmering, implementering og håndtering af NoSQL-løsninger kræver specialiseret low-level viden, som kun med besvær kan overføres fra den ene leverandør til den anden," skriver de to researchere, Erik Meijer og Gavin Bierman, i en artikel i aprilnummeret af Communications.
De to researchere tilbyder en matematisk datamodel og et standardiseret query-sprog, som kan bruges til at skabe en enhed mellem NoSQL- og SQL-datamodeller, som de kalder "CoSQL".
"Der er ikke meget i den artikel, som man kan være uenig i," siger James Phillips, der er medgrundlægger af og vice precident for NoSQL databaseleverandøren Couchbase, som ikke har været involveret i arbejdet.
"Jeg støtter i høj grad konklusionen om, at et standardiseret sprog til datamanipulation ville kunne accelerere markedsoptagelsen af NoSQL databaseteknologier ved at eliminere udvikler-fragmenteringen."
I løbet af de seneste år er en række ikke-relationelle databaser dukket op, blandt andet CouchDB, Cassandra og MongoDB.
Administratorer finder den form for datalagring mere egnet end relationelle databaser til opgaver som lagring af større mængder data på tværs af flere servere eller til hurtig lagring af informationer, som ikke behøver indeksering til komplekse søgninger.
Erik Meijer og Gavin Bierman sammenligner den nuværende bølge af ikke-relationelle databaser med udviklingen af relationelle databaser i begyndelsen af 1970'erne.
Dengang skulle udviklerne forstå det særlige ved hver enkelt database, og hvordan man interagerede med det underliggende hardware. Det der samlede branchen var udbredelsen af SQL (Structured English Query Language), mener de to researchere.
SQL var en implementering af Edgar F. Codds relationelle model, som tilbød en matematisk basis til modellering af databaser.
Modellen sikrede, at alle SQL-databaser gav det samme resultat til de samme søgninger, hvis de indeholdt de samme data. Og eftersom de fleste database-leverandører, som for eksempel IBM, begyndte at bruge modellen, kunne programmørerne nu nøjes med at lære SQL frem for et nyt sprog for hver database.
Milliard-industri
Erik Meijer og Gavin Bierman mener, at NoSQL på samme måde kan få glæde af en standardisering.
"På samme måde, som Codds opdagelse af relationel algebra som en formelbase for SQL, gav basis for en milliard-industri opbygget omkring SQL, så tror vi, at vores model vil muliggøre en tilsvarende økonomisk vækst for CoSQL," skriver de.
Researcherne stiller desuden spørgsmålstegn ved den alment udbredte opfattelse om, at NoSQL-databaser er særligt egnede til lagring af store datamængder.
"Det er muligt at skalere SQL-databaser ved omhyggelig partitionering," skriver de.
"Trods den almindelige antagelse, så er SQL og coSQL ikke hinandens diamentrale modsætninger, men i høj grad forbundne via skøn matematisk teori," skriver de.
Oversat af Marie Dyekjær Eriksen