Avatar billede learner Praktikant
13. september 2012 - 14:24 Der er 2 kommentarer og
1 løsning

Opsnappe redirect url

Hej

Jeg har lavet et script, som besøger en url, og hiver noget data derfra og bearbejder det til videre brug.

Mit problem er at jeg skal besøge denne side:
http://www.solhjulet.dk/product/1972/
og den jumper så automatisk videre til en anden url.
Kan man opsnappe den redirect url på en måde?

Så kan jeg nemlig starte med at besøge url'en og opsnappe redirect url'en, for bagefter at besøge den side og hente data.

Håber det er muligt :o)

Herunder har jeg de funktioner jeg bruger til det.


<php
function http_file_exists($url){
    $f=@fopen($url,"r");
    if($f){
        fclose($f);
        return true;
    }
    return false;
}
function file_get_contents_utf8($fn, $postdata=false) {
    if ($postdata){
        $opts = array('http' =>
            array(
                'method'  => 'POST',
                'header'  => "Content-Type: text/xml\r\n", // 'Content-type: application/x-www-form-urlencoded', //'Content-type: text/html; charset=UTF-8',
                'timeout' => 60,
                'content' => $postdata
            )
        );
        $context  = stream_context_create($opts);
        //print_r($opts);exit;
        $content = file_get_contents($fn, false, $context);
    } else {
        $content = file_get_contents($fn);
    }
    return mb_convert_encoding($content, 'UTF-8', mb_detect_encoding($content, 'UTF-8, ISO-8859-1', true));
}
function readFromRemote($url){
    if ($url){
        if (http_file_exists($url)){
            $output = file_get_contents_utf8($url);
            $output = preg_replace('/\xC2\xA0/',' ',$output);
            // do some stuff to $output
            return $output;
        }
    }
    return false;
}

echo readFromRemote('http://www.solhjulet.dk/product/1972/');

?>
Avatar billede DeeDawg Nybegynder
13. september 2012 - 16:10 #1
Først og fremmest, må jeg gøre dig opmærksom på at det er ulovligt at hente data på denne måde fra sites du ikke selv ejer. Også kaldet site scraping, selvom jeg er sikker på at du har reelle hensigter. Ligegyldigt hvad det er du henter fra siden, har de som udgangspunkt copyright på det, uanset om der står noget om det eller ej. Så hvis du ikke allerede har, skal du have tilladelse fra dem først. :)
Avatar billede learner Praktikant
13. september 2012 - 16:15 #2
Er der nogen som har et bud?
Avatar billede learner Praktikant
13. september 2012 - 17:01 #3
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Vi tilbyder markedets bedste kurser inden for webudvikling

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester