08. maj 2006 - 23:00Der er
13 kommentarer og 1 løsning
Apache sessions hænger
Jeg har på det sidste haft det kæmpe problem med min apache 2.0 server at de sessions som den kører, så at sige hænger og kræver enorme system ressourcer. Det skal dog forstås på den måde at de bliver afviklet, men processen hvori denne sker, er blevet enormt langsom. Jeg kan umiddelbart ikke tracke problemet, så det ville være rart hvis nogle måske kunne give mig nogle hints til kilden, eller måske selv har prøvet noget lignende.
Ved almindelig trafik fra få klienter ser fordelingen af ressourcer ud som på billedet her, hvilket jo virker helt absurd i forhold til hvad jeg er vant til maskinen kan yde: http://daffnier.dk/apache.JPG
Hmm, default_socket_timeout = 60 for php4 på apache2.
Af nye linjer i fejlloggen er, følgende. Men de lader ikke til at have den storre relevans? - det er ellers ærgeligt man ikke kan se mere specifikt på trådene for serveren. Jeg kan umiddelbart ikke se at der skulle køre en lykke på min server =/
[Mon May 08 22:24:13 2006] [error] [client 192.168.0.3] File does not exist: /var/www/gallery2/stats/favicon.ico [Mon May 08 22:24:13 2006] [error] [client 192.168.0.3] File does not exist: /var/www/gallery2/stats/favicon.ico [Mon May 08 22:27:46 2006] [error] [client 72.30.133.34] File does not exist: /var/www/default/robots.txt [Mon May 08 23:04:32 2006] [error] [client 213.237.93.227] File does not exist: /var/www/sysinfo/favicon.ico
De 4 linier er ligemeget. Du er velkommen til at kigge længere tilbage efter spændende ting. Socket timeout er nok ikke relevant ;) Hvad har du i max_execution_time? Og kører du noget som helst andet end PHP?
max_execution_time = 30, jeg kørte noget ASP.NET via mod_mono, men det er midlertidigt slået fra grundet problemet hér.
Men det lader rent faktisk til at det blot skyldtes en MySQL fejl, jeg er ikke helt sikker på om problemet er løst, men det kunne godt lade til det er. Jeg er selvfølgelig ked af hvis det er tilfældet og jeg har forstyrret dig, men har bikset med det den sidste uge, så følte mig efterhånden lost =/ - ved ikke hvorfor åbenbarringen skulle vise sig netop nu, hvis den gjorde.
Jeg vender i hvertfald lige tilbage i morgen og ser om der er fortsatte problemer. Du skal selvfølgelig have de udloddede 30 point hvis det virker =)
Jeg samler slet ikke på point, så det skal du ikke spekulere på. Men fortæl os endelig hvad fejlen egentlig var, når du ved det! Grunden til at jeg spurgte om andet end PHP var erfaring fra gamle dage, hvor uendelige løkker på JSP-sider (apache/resin) kunne give samme reaktion.
Jeg er faktisk ikke så sikker på hvor fejlen lå/ligger, ud over at den har været i en af mine to Gallery 2 installationer, bl.a. http://gallery.r-i-p.dk/.
Jeg har haft alle disse slået fra i en periode, hvor serveren kørte fint. Nu har jeg haft ovennævnte adresse åbent i 2 døgns tid og det virker også strålende. Jeg venter et par dage endnu, hvis de også forløber fejlfrit prøver jeg at genåbne min sidste installation, http://gallery.tougaard.net/.
Okay, nu er jeg blevet svagt klogere, jeg kan nemlig sige så meget som at fejlen helt sikkert ligger i min Gallery 2 installation. Den optræder stadig, med at Apache2 sessions hænger urimeligt lang tid og bruger mange ressourcer. Det er meget ærgeligt at jeg ikke kan overvåge hvilke scripts Apache2 kører, siden det ville gøre mig i stand til at udpege fejlen mere præcist og meddele det til Gallery 2 devlopment teamet =/
Slet ingen som ved om jeg på nogen måde kan komme dybere ned til problemet?
Der sker nogle forskellige ting her i min error.log, som måske har relevans?
[Thu May 18 18:48:18 2006] [warn] child process 11551 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 11787 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10958 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 11559 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 8486 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10604 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10960 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10962 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 8935 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 7090 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 11567 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 7911 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 11572 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 11791 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 9105 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10975 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10978 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10985 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 11797 still did not exit, sending a SIGTERM [Thu May 18 18:48:18 2006] [warn] child process 10995 still did not exit, sending a SIGTERM [Thu May 18 18:48:20 2006] [warn] child process 11551 still did not exit, sending a SIGTERM [Thu May 18 18:48:26 2006] [notice] caught SIGTERM, shutting down [Thu May 18 18:48:29 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 18:48:29 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 18:48:29 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 18:48:29 2006] [notice] suEXEC mechanism enabled (wrapper: /usr/lib/apache2/suexec2) [Thu May 18 18:48:30 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 18:48:30 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 18:48:30 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 18:48:30 2006] [notice] Apache/2.0.54 (Debian GNU/Linux) PHP/4.3.10-16 mod_ssl/2.0.54 OpenSSL/0.9.7e mod_perl/1.999.21 Perl/v5.8.4 configured -- resuming normal operations [Thu May 18 19:00:09 2006] [error] server reached MaxClients setting, consider raising the MaxClients setting [Thu May 18 20:33:22 2006] [notice] caught SIGTERM, shutting down [Thu May 18 20:33:24 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 20:33:24 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 20:33:24 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 20:33:24 2006] [notice] suEXEC mechanism enabled (wrapper: /usr/lib/apache2/suexec2) [Thu May 18 20:33:26 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 20:33:26 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 20:33:26 2006] [warn] RSA server certificate CommonName (CN) `*.tougaard.net' does NOT match server name!? [Thu May 18 20:33:26 2006] [notice] Apache/2.0.54 (Debian GNU/Linux) PHP/4.3.10-16 mod_ssl/2.0.54 OpenSSL/0.9.7e mod_perl/1.999.21 Perl/v5.8.4 configured -- resuming normal operations
Det med RSA servercertifikatet ligemeget, det er udstedt til navnet siden jeg bruger SSL forbindelse til flere subdomæner på tougaard.net. Men der er "server reached MaxClients setting" og familien af "child process *** still did not exit, sending a SIGTERM" som måske skyldes mine hængende sessions?
Det kunne godt se ud til at du har nogle processer, der ikke stopper af sig selv. Check lige igen at du har en max_execution_time = 30 ved at lave en fil med <? phpinfo(); ?>
Når det går galt, er du eller andre så igang med at uploade store billeder, der skal ændres i størrelse - det plejer at tage tid med de her moderne NNN-megapixels kameraer vi har ?
Det går overhovedet ikke galt når der uploades store billeder til serveren nej, det er meget tilfældigt og pludseligt det kommer. Man kunne forestille sig at der var en fejl i et enkelt script, som kun anvendes i ny og næ?
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.