CIO Tech Eksperten IT-JOB IT-Kurser Events Podcast Søg

Log ind eller opret profil

Du kan også logge ind via nedenstående tjenester

havmaage Juniormester

04. marts 2009 - 22:16 Der er 6 kommentarer og
1 løsning

web crawler

hej hvis jeg nu ville lave en webcrawler der indsamlede pandekage opskrifter eller andre ting fra forskellige sider, er der så noget lovmæssigt involveret, man kan vel ikke sådan uden videre bare hente forskelligt materiale fra andre sider...

Rent teknisk, findes der nogle guides f.eks gerne i php eller anden open source...findes der evt. program skeletter man kan bygge videre på.

og er det svært at kode en web crawler

Synes godt om

arne_v Ekspert

04. marts 2009 - 22:31 #1

Hvis du kun leverer links udfra soegeord (Google style) saa mener jeg ikke at du skal spoerge om lov.

Hvis du leverer hele content som en del af din side, saa skal du have tilladelse.

En crawler er ikke saa svaer at kode hvis man har solid programmerings erfaring. Man skal lave HTTP GET, HTML parse og styre diverse timeouts og holde styr paa hvad man har crawlet (og respektere robots.txt).

Mne PHP er naeppe det rette sprog for en crawler.

Synes godt om

mstorgaard Praktikant

04. marts 2009 - 22:31 #2

Jeg vil mene, at det ligger i den mere avancerede ende at lave en webcrawler - i hvert fald en webcrawler, der skal kunne bruges til noget ordentligt.

Og der er meget lovmæssigt involveret, da du jo oftest set ikke må tage en sides indhold og fremvise det på din egen side uden direkte tilladelse eller en tydelig kildehenvisning (kildehenvisning er ikke altid nok).

Så det er nok et større projekt, du er på vej ud i.

Synes godt om

havmaage Juniormester

05. marts 2009 - 08:22 #3

mange tak for jeres kommentarer, det tekniske skulle jeg nok med engagement og en større insats kunne komme igennem og få et resultat der ville være ok på amatør niveau, men jeg er lidt i tvivl om jeg gider alt bøvlet med tilladelser kildehenvisninger m.m

Jeg ville jo nok selv føle mig trådt lidt over tæerne hvis materiale på min egen side sådan uden videre blev brugt systematisk andre steder, i hvert fald hvis det var commercielt.

Nu tror jeg jeg vil tænke lidt mere over hvad indholdet skulle være og hvad perspektivet ville være inden jeg kaster mig over design og kode.

Synes godt om

barskelauer Nybegynder

05. marts 2009 - 22:06 #4

http://bauerdata.bauerhost.dk/python-program-eksempler/pyspider

Synes godt om

havmaage Juniormester

24. juni 2009 - 10:07 #5

Mange tak for indlæg (lidt sent ude) Jeg skal lige som have fordelt point og jeg synes alle indlæg var informerende så læg venlist et svar :-)

Synes godt om

mstorgaard Praktikant

24. juni 2009 - 12:35 #6

Jeg springer over. (:

Synes godt om

arne_v Ekspert

24. juni 2009 - 14:00 #7

svar

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Andet programmering kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Bat-fil / vbs til ændre af filnavn udfra mappe-navn Af tjodense i Andet programmering	3	10/04/202511:18	11/04/202513:49
Echo virker ikke i php Af KurtG i Andet programmering	10	23/02/202511:57	24/02/202510:01
Rewrite i .htaccess til Joomla 5 Af andrew i Andet programmering	5	15/01/202520:23	16/01/202522:59
Kodning af element i custom css Af Jacob Hedelund i Andet programmering	3	14/10/202410:35	14/10/202419:46
Delphi 11 - converter webp til jpg fil Af juzas i Andet programmering	5	12/10/202413:28	14/10/202403:54

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

21:05

AI-lab #2: Sådan får du fuld udnyttelse af Microsoft Office med nem programmering - og lær om super-prompts

14:00

Bliv it-driftsdirektør hos Metro Service eller bidrag til PET’s offensive operatinoer: Her er 10 ledige stillinger, som du kan søge i påsken

12:00

På uventet eventyr i det ydre rum: Ved en fejl bliver en dreng jordklodens repræsentant

17/04

Hvordan skaber vi en mere menneskevenlig digital fremtid? Få nogle bud her

17/04

Kritisk CVE-databasen om sikkerhed reddet i allersidste øjeblik - ny bevilling godkendt

16/04

Netcompany-stifterne André Rogaczewski og Claus Bo Jørgensen skovler penge ind: Har tjent næsten 600 millioner kroner på et år

16/04

Prøvekørt: Der er mange gode grunde til at kalde BMW i5 for den bedste el-stationcar til dato

16/04

Sådan modererer Mads og 20 andre danskere alt indhold på Metas danske platforme fra et center i Barcelona

16/04

Jeg købte tømmermands-pizza for alle mine bitcoins og gik glip af en formue: Nu overvejer jeg at gå all-in igen

16/04

Ny fond haste-etableret: Vil forsøge at redde sårbarhedsdatabasen CVE fra nedlukning

16/04

Den omstridte rigmand Peter Thiels selskab Palantir lander vigtig ordre hos Nato: En sejr for USA

Vis flere artikler

IT-JOB

Nordic RCC

Application Architect at the heart of the Nordic Green Transition

KMD A/S

SAP Consultant - Opus Økonomi

Københavns Universitet

Københavns Universitets søger specialister i informationssikkerhed

Netcompany A/S

IT Consultant

SDC A/S

Team Leader - Core Banking

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I dag 17:21	Mobil Samsung, app email fungerer ikke Af OBS i Apps til Android
I dag 17:14	eclipse Af OBS i Java
I dag 16:52	Åbne en PDF fil fra en mappe Af mbl i JavaScript
I dag 13:15	Efter lukning af Edge, hvordan gendannes alle fanebladene? Af Philip Kuhlmann i Browsere
I går 15:46	Meta AI = Svær at foor væk ? Af Ikke-ekspert i Chat & Messaging