Notifikationer

Markér alle som læst Log ud

cwboy Nybegynder

05. juli 2006 - 13:53 Der er 11 kommentarer og
1 løsning

Fjern men behold

Jeg har brug for en reg.exp. (til brug i .NET) der kan fjerne men beholde (og beholde dem som dobbelte)

Den skal tage højde for "dialekter". Ex. , , , osv.

Er ikke ligefrem en haj udi reg.exp. - de driller altid :(

Synes godt om

cwboy Nybegynder

05. juli 2006 - 13:57 #1

Rettelse... enkelt- skal erstattes med mellemrum - og dobbel- skal ikke erstattes.

Synes godt om

gizmo-gizmo Nybegynder

05. juli 2006 - 15:43 #2

Hvad med noget så simpelt som:

(<(br|BR) ?\/?>){2}

Synes godt om

cwboy Nybegynder

05. juli 2006 - 16:05 #3

Jeg har fx følgende (test)-tekst:

Her er en artikel Og i artiklen er der indbygget linjeskift, som jeg vil have fjernet, så det er browseren der bestemmer hvornår der skal laves linjeskift. Med undtagelse af når der står 2 linjeskift som er inddeling af afsnit.

Det skulle gerne blive til

Her er en artikel Og i artiklen er der indbygget linjeskift, som jeg vil have fjernet, så det er browseren der bestemmer hvornår der skal laves linjeskift. Med undtagelse af når der står 2 linjeskift som er inddeling af afsnit.

Ovenstående kan jeg vel kun bruge til at matche 2 'er efter hinanden - og det er jo ikke det, jeg er ude efter... faktisk er jeg ude efter at matche som IKKE må være efterfulgt af et nyt .

Dvs. den skal matche de " "'er der står alene, og ikke de dobbelte - som skal bibeholdes som dobbelte.

Synes godt om

gizmo-gizmo Nybegynder

05. juli 2006 - 16:30 #4

Ups, det var mig der var en idiot og ikke kunne læse spørgsmålet.

Jeg har ikke lige erfaringer med at bruge regexp i C#, men hvis du kan bruge "lookahead" kunne du f.eks.:
( )(?! )

Den matcher et tag hvor der foran IKKE også er et tag

Synes godt om

gizmo-gizmo Nybegynder

05. juli 2006 - 16:31 #5

gahh.......

Synes godt om

gizmo-gizmo Nybegynder

05. juli 2006 - 16:35 #6

glem mit svar ;)

Synes godt om

Slettet bruger

05. juli 2006 - 17:10 #7

Jeg vil tillade mig at foreslå noget helt andet. Da dobbelt skal bruges til at angive nyt afsnit, hvad så med at skifte det ud med den kode, som netop betyder at her kommer et nyt afsnit? Så er der ingen dobbelte til at drille, når du bagefter fjerner de enkelte .

Koden for nyt afsnit er 

Hvis det skal være gyldigt xhtml, så skal du sørge for at have en i starten også.

Synes godt om

nielle Nybegynder

05. juli 2006 - 17:58 #8

Prøv at kigge på denne her:

using System;
using System.Text.RegularExpressions;

namespace r719161
{
class Program
{
static void Main(string[] args)
{
string text = @"Her er en artikel Og i artiklen er der indbygget linjeskift, som jeg vil have fjernet, så det er browseren der bestemmer hvornår der skal laves linjeskift. Med undtagelse af når der står 2 linjeskift som er inddeling af afsnit.";
Console.WriteLine(text);

Regex re = new Regex(@"(?<!<br(?:\s*/)?>)<br(?:\s*/)?>(?!<br(?:\s*/)?>)", RegexOptions.IgnoreCase);

Console.WriteLine();

text = re.Replace(text, " ");
Console.WriteLine(text);
}
}
}

Synes godt om

cwboy Nybegynder

05. juli 2006 - 19:37 #9

nielle - smider du et svar. Det var præcis, hvad jeg var ude efter :)

sandbox - godt forslag, som jeg også selv overvejede. Det er artikler, der kommer "udefra", så vi har ikke altid 100% styr på, hvordan de bliver formatteret. Nogen i rå tekst og nogen i HTML - for at have nogenlunde styr over outputtet i alle formater vil vi ikke blande for mange tags ind i det. Selvom det HTML-mæssigt måske ville være den bedste løsning.

Synes godt om

nielle Nybegynder

05. juli 2006 - 19:39 #10

Svar :^)

Synes godt om

gizmo-gizmo Nybegynder

05. juli 2006 - 20:33 #11

Nielle: Jeg har lige et spørgsmål. Det var lidt det samme jeg havde forsøgt mig med (altså en negativ lookbehind og lookahead), men da jeg prøvede det i PHP gav det mig fejlen "lookbehind assertion is not fixed length", så jeg troede ikke det var muligt. Hvordan kan det være at det virker i C# og ikke PHP?

Synes godt om

nielle Nybegynder

05. juli 2006 - 21:05 #12

> Hvordan kan det være at det virker i C# og ikke PHP?

Der er mere regelen end undtagelsen at regex-implementationen variere fra programmerinsgssprog til programmerinsgssprog. Og netop lookbehind er i øvrigt et af de steder hvor der er meget forskel (f.eks. understøttes det slet ikke i VB Script/ASP).

Jeg er ikke ekspert i detaljerne omkring PHP's preg_xxxx() implentation, men det lader altså til at *-qualifieren ikke er tilladt i en lookbehind.

Uden dog at have afprøvet den, vil jeg gætte på at denne virker i PHP:

(?<!(?: | | ))

Den dækker selvfølgelig ikke så bredt som versionen med \s*, men mon ikke at den alligevel rammer de relevante tilfælde?

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Andet programmering kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Hjælp til Api.asmx Af lurup i Andet programmering	1	17/03/202609:27	17/03/202614:12
burgermenu til hjemmeside - hjælp! Af SabrinaL i Andet programmering	2	12/11/202514:10	02/12/202520:42
Hjælp til programmering af website Af hamdenlange i Andet programmering	16	17/08/202522:26	19/08/202515:53
Kan man registrere hvis folk lukker en side ned Af KurtG i Andet programmering	8	24/07/202513:06	28/07/202517:03
hta - powershell eller lign. Af tjodense i Andet programmering	2	28/04/202515:22	29/04/202512:00

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS