IPB

Willkommen, Gast ( Anmelden | Registrierung )

 
Reply to this topicStart new topic
> Spaghetti-Code verschlanken
Gast_ipante_*
Beitrag 17.03.2004 - 17:44
Beitrag #1





Gäste






Hallo,

habe eine größere Webseite (>200 Textdateien) übernommen, die offensichtlich mit einem WYSIWYG-Editor erstellt worden ist und fürchterlichen Spaghetti-Code entält.

Ich mache mich nun langsam daran, das Elend zu entwirren und ordentliches HTML mit CSS zu erzeugen. Kennt jemand vielleicht ein tool, um gezielt tag Attribute zu löschen, so dass einfaches HTML übrig bleibt? Meine bisherigen Versuche mit html2txt Konvertern sind zu aufwendig und Perl will ich dafür nicht gleich lernen ;)

Besten Dank,
Iannis
Go to the top of the page
 
+Quote Post
Auge
Beitrag 18.03.2004 - 0:58
Beitrag #2


Anwärter auf W3.org Mitgliedschaft
*****

Gruppe: User
Beiträge: 550
Mitglied seit: 28.11.2001
Wohnort: Berlin Friedrichshain
Mitglieds-Nr.: 107



Hallo

Mit dem Tidy-Plugin (plus der tidy.exe) sollte das gehen.
Dort kann man den erwünschten Doctype angeben und alle
falschen Attribute fliegen raus.

Ist meine erste Idee.

Tschö, Auge
Go to the top of the page
 
+Quote Post
Conny
Beitrag 18.03.2004 - 8:39
Beitrag #3


Kommt Zeit, kommt Rat, kommt Conrad!
Gruppensymbol

Gruppe: Mods
Beiträge: 1.169
Mitglied seit: 21.11.2001
Wohnort: Altenkirchen, Westerwald
Mitglieds-Nr.: 42



Hallo,
ich wurde es mit (Datei übergreifendes) Suchen und ersetzen machen, ist zwar immer noch viel 'Handarbeit', Du behältst aber besser die Kontrolle...

Es gibt -für kleinere Sachen auch noch das Optimizer PlugIn mit dem Du z.B. <strong> in <b> verändern, und die Frontpage-Robots entfernen kannst.

cu
Conny
Go to the top of the page
 
+Quote Post
Gast_ipante_*
Beitrag 18.03.2004 - 14:36
Beitrag #4





Gäste






Danke erstmal für das feedback.

Tatsächlich dachte ich zunächst auch an eine Kombination von tidy und (dateiübergreifendem) Ersetzen. Allerdings hab ich dabei Probleme, da sich mir die Syntax Regulärer Ausdrücke nicht erschliessen will. Kann halt nicht so gut abstrakt denken. Also, ein einfaches "ersetze <td*> mit <td> klappt nicht.
Kann vielleicht jemand die Syntax für diesen Befehl posten?:

"Ersetze/Lösche alle Zeichen zwischen '<td' und dem nächsten '>'"

Das wäre eine große Hilfe.

Eine andere Möglichkeit, die ich gefunden habe, ist der kombinierte Einsatz der Programme html2table und table2html von Stefan Petterson (http://www.stefan-pettersson.nu), leider gehen dabei die Links verloren.

@Conni
Kann leider kein PlugIn dieses Namens entdecken oder meinst Du tidy?

TIA
Iannis
Go to the top of the page
 
+Quote Post
helpy
Beitrag 18.03.2004 - 15:01
Beitrag #5


;-)
Gruppensymbol

Gruppe: Mods
Beiträge: 246
Mitglied seit: 20.11.2001
Mitglieds-Nr.: 15



QUELLTEXT
<td[^>]*>


Funktioniert aber nicht über mehrere Zeilen! zwischen "<td" und ">" darf also kein Zeilenumbruch sein!

cu, helpy
Go to the top of the page
 
+Quote Post
Gast_ipante_*
Beitrag 18.03.2004 - 15:18
Beitrag #6





Gäste






@helpy
Danke!

Reguläre Ausdrücke erinnern mich schwer an Polynomdivison, dem ganz persönlichen Horror meiner Schulzeit :prayer:.

Das mit den Zeilenumbrüchen macht ja nichts, die kann man ja zunächst z.B. mit Metapad entfernen und nach der Manipulation dann Tidy benutzen.

Iannis
Go to the top of the page
 
+Quote Post
Conny
Beitrag 18.03.2004 - 15:35
Beitrag #7


Kommt Zeit, kommt Rat, kommt Conrad!
Gruppensymbol

Gruppe: Mods
Beiträge: 1.169
Mitglied seit: 21.11.2001
Wohnort: Altenkirchen, Westerwald
Mitglieds-Nr.: 42



Hi,
ZITAT
@Conni
Kann leider kein PlugIn dieses Namens entdecken oder meinst Du tidy?


Nein, ich meine nicht Tidy!
Es ist eine DLL die einfach in das PlugIn Verzeichnis gestellt wird.
Du kannst sie hier Downloaden:http://www.trimmelterhof.de/foren/download...d/Optimizer.zip

Ich habe jetzt nicht nachgesehen ob sie nicht auch hier im Downloadbereich vorhanden ist. Wenn nicht kann man (Andreas :wink: ) sie vieleicht auch dort einstellen...

cu
Conny
Go to the top of the page
 
+Quote Post
Google Bot
Beitrag
Beitrag #


Google Ads









Go to the top of the page
 
Quote Post

Reply to this topicStart new topic
1 Besucher lesen dieses Thema (Gäste: 1 | Anonyme Besucher: 0)
0 Mitglieder:

 



RSS Vereinfachte Darstellung Aktuelles Datum: 07.05.2024 - 16:59

taschenkalender
expertise-panel IPS Driver Error

IPS Driver Error

There appears to be an error with the database.
You can try to refresh the page by clicking here