Hent specifik Date fra HTML doc?+MySql
Jeg har brug for et script jeg man fodre med en liste over online html filer med samme format som nedenstående.Ud fra dette html dokument skal der hentes nogle specifikke data som så skal puttes i min mysql DB.
DB navn: produkter
1)DB felt = titel
her forestiller jeg mig at man kan søge efter start <title> tagget og så hente alt der står inden "-" og så trimme det, så slut resultatet bliver: ”cykel med fine hjul osv”
2)DB felt = Kort_Beskrivelse
Her findes den korte beskrivelse både i Description meta taggen og længere nede i koden mellem de 2 ””, ved ikke hvor det er lettest at hente den ud, men vælg det bedste sted. Hvis ” &” forekommer skal det laves om til & tegnet inden det smides i db’en.
Så slut resultatet bliver: ”dette skal hentes ud & smides i DB feltet Kort_Beskrivelse”
3)DB felt = Lang_Beskrivelse
Denne er lidt tricky, jeg ved ikke hvordan det skal hentes ud, men min idé er at gå efter den første forekomst af et link til min index.php side, da dette link altid vil være at finde i Den lange beskrivelse, og så ud fra dette links placering finde start og slut punkt for den text mængde?
Feks: start <TD> og slut: <BR>
4)DB felt = Pris
Skulle være let nok, bare søg efter den første forkomst af ordene ”Ny pris” og så hente det næste ord ud og trim det, så det bliver ”350”
Selve URL’en til html filen vil være feks:
http://ww.blabla.dk/produkter/200S/cykel_uden_hjul.html
5)DB felt = Filnavn:
her skal den tage ”cykel_uden_hjul” fra HTML Url’en
6)DB felt = Id
når den skal vide hvilken DB row Id. Den skal vælge skal den gå udfra nummeret i URL’en, så den Row den opretter er = 200
Der kan godt forekomme apostroffer og andre tegn i teksten, jeg ved ikke om mysql vil klage over det ved indsætning?
<HTML>
<HEAD>
<TITLE>cykel med fine hjul osv - blabla</TITLE>
<META content="dette skal hentes ud & smides i DB feltet Kort_Beskrivelse" name=description>
</HEAD>
<BODY><DIV align=center><TABLE width=760>
<TBODY><TR><TD align=middle height=35>
<FONT size=+0><B>"dette skal hentes ud & smides i DB feltet Kort_Beskrivelse" - produkt fra blabla.dk</B></FONT> </TD></TR>
<TR><TD align=middle><TABLE cellPadding=5 width=600>
<TBODY>
<TR>
<TD>denne beskrivelses txt skal også hentes ud, den er men burde kunne klares denne beskrivelses txt skal også<A HREF="http://www.blabla.dk/index.php">hentes ud</A>, den er svær men burde kunne klares denne beskrivelses txt skal også hentes ud, den er svær men burde kunne klaresdenne beskrivelses txt skal også hentes ud, den er svær men burde kunne klares?<BR>
<CENTER><FONT SIZE="0"><B>Ny pris 350 Dkr!</FONT></CENTER>
</TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV>
</BODY>
</HTML>