Avatar billede larson_747 Nybegynder
29. september 2008 - 10:34 Der er 2 kommentarer

Importering af data fra mange ustrukturerede txt dokumenter

Jeg håber nedenstående problemstilling giver mening :-)

Problem:
- Jeg har et enormt antal dokumenter (txt), hvori der ligger ca. 20 liniers ustrukturerede data som jeg ikke er interesseret i og 50 liniers ustrukturerede data som jeg skal lave nogle statistiske analyser på.
(Indholdet af dokumenterne er indbyrdes forbundne, således at eksistensen af 1 element data i det følgende dokument har betydning for om samme element i det forrige giver mening - så jeg har behov for at kunne fjerne informationen undervejs)

Jeg mangler en god måde at hente disse data ind i struktureret form, således jeg kan behandle dem.

- Hvordan kan jeg automatisere hentning af data fra tekstdokumenterne?
- Hvordan kan jeg fjerne elementer undervejs?
- Hvilket program er rigtigt godt (og nemt) at lave statistiske analyser med?
Avatar billede arne_v Ekspert
30. september 2008 - 04:09 #1
Du skal vel skrive et program.

Udfra de foreliggende oplysninger er det nok svært at sige ret meget mere.
Avatar billede arne_v Ekspert
25. oktober 2008 - 23:05 #2
?
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Computerworld tilbyder specialiserede kurser i database-management

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester