Avatar billede Mcoroklo Nybegynder
15. oktober 2010 - 13:51 Der er 1 kommentar og
1 løsning

(Alle kan hjælpe!) - Algoritme til bestemmelse af "hjemmeside type"

Jeg har overvejet det her noget tid, så jeg tænkte at jeg ville spørge her på siden..

Jeg har en crawler som kommer ind på en eller anden hjemmeside.. Det kunne være alt fra www.eksperten.dk, www.jakobspersonligeblog.dk eller www.facebook.com. Herefter har jeg behov for at beslutte hvilken type hjemmeside vi er på.. Typer kunne jo f.eks. være:

- Forum
- Blog
- Link katalog
- Social media side
- Nyhedsside
- Enmandsside

Jeg har brainstormet lidt tid, og den bedste løsning i mit hoved lader til at være en eller anden heuristik, baseret på et point system. Kort sagt: Forskellige "trends" giver forskellige points, til de forskellige typer.

Men jeg går lidt i stå... Hvordan detekterer man trends?

- Link kataloger kunne være nemme: Hvis antallet af sider indekseret / udgående links er meget højt, så er sandsynligheden for at vi har et link katalog storts

- Nyhedssider/Blogs: Her er antallet af artikler med en "Dato" ret stort..

Men jeg synes det er svært at finde nok trends til at lave noget smart..

Så mit spørgsmål er:
HVORDAN LØSER MAN DET HER?

*** Høj niveau foreslag såsom "du kunne jo lede efter en reply knap" er også helt fint..! ***

På forhånd, mange tak!
Avatar billede noltus Novice
15. oktober 2010 - 16:29 #1
http://www.google.com/trends er det noget ala det her du tænker på
Avatar billede Mcoroklo Nybegynder
11. november 2010 - 11:36 #2
@Noltus,
Nope..

Det viste sig at være et MEGET svært problem, som man kun løser vha. neurale netværks.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester