Antworten auf deine Fragen:
Neues Thema erstellen

Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

grafik_avd

Tier mit Falls-Beutel

Ein herzliches Hallo an die InDesign-Könner!

Ich hab folgendes Problem:
Ich habe es mit einem Text zu tun, der in seinen Fußnoten massig URLs in Kombination mit Fließtext enthält. Die Zeichenfolgen der URLs werden an einigen Stellen logischer Weise an ihren Interpunktionszeichen getrennt. Ich weiß, daß ich das einfach händisch mit "Unterbrechung unterdrücken" unterbinden kann.

Jetzt meine Frage: Kann ich das irgendwie automatisieren? Hab schon Tante G gefragt und knote mir gerade das Hirn, ob ich das mit einer GREP-Abfrage lösen könnte, komm da aber nicht weiter. Da ich in Sachen Programierung etc. kaum bis gar nicht fit bin.
Die Suchkriterien hab ich mir so gebaut: www\.\w+\.\w+\/\w+\/
Funktioniert auch. Aber meine Vermutung ist, daß ich über GREP keine Textelemente kopieren kann und nur die Interpunktion geschützt auswechsele. Richtig?!
Gibts da eventuell ein tolles Skript für?

Ich hoffe ihr könnt mir helfen. Ansonsten ist wohl Handarbeit angesagt!
Liebe Grüße Paul
 
Zuletzt bearbeitet:

Design & Layout

Ellersiek

JedenTag ein wenig besser

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Wenn deine GREP-Abfrage funktioniert, dann könnte auch ein GRE-Stil funktionieren:
  • Zeichenformat definieren (Im Beispel "KeinUmBruch")
  • Im gewünschten Absatzformat für die Fussnote GREP-Stil eintragen

Das müsste dann automatisch funktionieren.

Gruß
Ralf
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

JA! :D
Hervorragend! Ich danke dir.
Manchmal sieht man den Wald vor lauter Bäumen nicht. An GREP-Stile hatte ich gar nicht gedacht.

Inzwischen hab ich auch noch für die Ersetzten-Abfrage etwas verbessert hingeschustert bekommen. Bücher sind schon echt eine Tolle Sache :)
Suche
(www)\.(\w+)\.(\w+)\/(\w+)\/(\w+)
Ersetzen
$1.$2.$3/$4/$5

Eber mit einem GREP-Stil komm ich natürlich besser, zumal bei meiner Variante immer noch Textteile umgebrochen werden.

Also nochmals Danke! Und Problem gelöst.

Edit:
Wenn es nochmal gebraucht werden sollte hab ich die GREP-Abfrage etwas vereinfacht. Die Abfrage sollte eigentlich auf gängige URLs anwendbar sein:

www\.[0-9a-zA-Z\-]+((\.|\/)[0-9a-zA-Z\-]+)+

Das ganze wird nur problematisch, wenn die URL über mehrere Zeilen geht.
 
Zuletzt bearbeitet:
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Webadressen per Grep zu erfassen ist nicht wirklich leicht. Um deine Fundstellen zu erhalten, sollte aber auch schon
Code:
w{3}[^\s]+
ausreichen. (Kleine Zusatz-Info: Slash mit nachfolgendem s verschwindet meistens beim C&P, also bitte kontrollieren)
;)

Im Gegensatz zu deinem „vereinfachtem“ Code findet dieser Grep z.B. auch
Code:
http://www.psd-tutorials.de/forum/183_indesign/144637-kann-man-den-umbruch-von-zeichenfolge-urls-automatisiert-verhindern.html
IMHO ist es allerdings nicht ganz einfach, solche Monster-Urls in einer Zeile ohne Umbruch unterzubringen.

Gib einfach ein Feedback zurück (und eventuell postest du auch falsch falsche und falsch positive Fundstellen)
;)
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

IMHO ist es allerdings nicht ganz einfach, solche Monster-Urls in einer Zeile ohne Umbruch unterzubringen.

Gib einfach ein Feedback zurück (und eventuell postest du auch falsch falsche und falsch positive Fundstellen)
;)

Na klar wird die ganze Sache ab einer gewissen Länge nicht mehr realisierbar, aber bei den URLs mit denen ich es bis dato in dem Dokument zu tun habe, geht das.

für www-adressen klappt dein Code hervorragend. Wo er nicht greift sind Seiten von wikis z.B:
Code:
http://de.wikipedia.org/wiki/GREP

Hab mal kurz versucht ihn zu erweitern
Code:
(w{3}|[\l\u]+)\.[0-9a-zA-Z][^\s]+
Ist aber auch noch nicht das Ultimo glaube ich. Das Problem ist die Stelle nach \.
da muss man \. und \: ausklammern, da sonst Abkürzungen mit einer doppelten Interpunktion (Nr.: | vgl.: etc) mitkommen.
Und da bin ich mit meinen Kenntnissen in der Sprachlogik von GREP erstmal am Ende. :)
Aber für den Garten reichts.
 
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Ähem,
du hattest nie erwähnt (und auch in deinem bisherigen Codeversuchen war das nie der Fall), dass du nach URLs ohne www suchen möchtest/musst.

Drei Möglichkeiten: Entweder beziehst du das http mit in die Suche ein z.B.
Code:
http[^\s]+
findet und übergibt die Adresse mit dem vorangehendem http .

Oder
du findest das http und übergibst es nur dann, wenn kein www nachfolgt. Das sähe dann so aus:
Code:
http://(?!w{3})[^\s]+|w{3}[^\s]+


Oder
du postest einfach ein paar dutzend Adressen (eventuell auch per PN), aufgrund derer man ein konkretes Suchmuster erstellen kann. Ansonsten muss ich blind meiner Kristallkugel vertrauen (und die belügt mich leider manchmal
biggrin.gif
)

Wie ich eingangs schon sagte:
Webadressen per Grep zu erfassen ist nicht wirklich leicht.
icon_nick.gif


Indizierung für die foreneigene Suche:
Grep Grepsuche Grep-Suche Webadresse Web-Adresse Internetadresse Internet-Adresse URL URLs
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Ähem,
du hattest nie erwähnt (und auch in deinem bisherigen Codeversuchen war das nie der Fall), dass du nach URLs ohne www suchen möchtest/musst.

Stimmt das habe ich auch nicht erwähnt, weil es da noch nicht der Fall war.
:)
Dann kam der Redaktionelle Prozess dazu und ich gebe es zu, auch der persönliche Foscherdrang. Wenn ich mal wieder ordentlich Zeit habe, werde ich mich mal versuchen in das Thema mehr rein zu knien, bringt ja wirklich eine Menge Vorteile mit sich, man muss es nur können.

Aber ich glaube mit dem Material sollte ich den Rest bewältigen können.
Ich danke dir jedenfalls wahnsinnig für die schnelle und kompetente Hilfe und schick dir als Dankeschön eine kleine Flasche digitalen Glas/Kristall-Reiniger und Veritas-Serum :D
 
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

d' Kugel isch scho putzt, on d'r veritas kriegscht wieder.

Kascht m'r blos no au verzähle, ob ftp un https au no g'funne werre muss?

:)
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

näh, muss ni gesucht wer'n, abor 's wär schon gudd zu wiss'n, wenn 'sch so dreist sein doarf.

:)
 
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Code:
(?i:\S{1,5})?[_.:](\S{3})(\S+\>[/_]?)
könnte funktionieren, habe ich mal vor Jahren angetestet, aber nie wirklich ausgetestet.

Geht bestimmt mit meinem heutigen Wissen noch einfacher zu formulieren. Vielleicht möchtest du den Grep einmal ausführlicher testen und ein Feedback geben???
;)
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Das sieht impossant aus. :nick:

Mal sehen wie es nach Beendigung der jetzigen Arbeit zeitlich aussieht. Aber dieser verfluchte Forscherdrang wird sich schon seinen Weg bahnen.

Und wenn man so einen GREP funktionsfähig da hat kann das ja nie schaden.
 
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Ja, das sieht vielleicht imposant aus. Und man sieht dem Teil auch nicht an, dass es eigentlich überhaupt nicht für die Suche nach URLs erstellt worden ist.

Ich habe nämlich meinen Uralt-Beitrag aus einem anderen Forum wiedergefunden. Dieser Grep half eigentlich dem Auffinden einer bestimmten Art von Seriennummern im Fliesstext. Als Nebeneffekt wurden Internetadressen aller Art gefunden.

Und genau diesen Nebeneffekt hatte ich noch im Hinterkopf.
:)

Möchtest du jetzt eigentlich noch einen Grep für Internetadressen?
Kannst du deine Vorkommen noch etwas präzisieren?

1) Kann es vorkommen, dass diese Adressen einen Slash, einen Unterstrich oder einen Doppelpunkt am Ende besitzen?
2) Sollen FTP-Adressen auch gefunden werden?
3) Sollen HTTPS-Adressen auch gefunden werden?
4) Stehen die Internetadressen im Fliesstext, d.h. es kann ein Satzzeichen direkt nach der Adressen folgen?
5) Können die Internetadressen auch ganz oder teilweise mit Großbuchstaben vorkommen?
:uhm:
 
Zuletzt bearbeitet:

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Wenn die Frage so nett gestellt wird :)
Ja, ich möchte noch einen grep für Internetadressen. Aber bis dato löst der letzte von dir gepostete alle aufgetauchten Problemstellen.

1)
ja
2) nein
3) nein
4) ja
5) ja
 
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

:D Auf die zwei Nein kommt es auch nicht wirklich an.
Kleine Grep-Geisterstunde gefällig?

Code:
http
findet http

Code:
https
findet https

Code:
ftp
findet ftp

Code:
http|https|ftp
findet http oder https oder ftp

Code:
HTTP|HTTPS|FTP
findet HTTP oder HTTPS oder FTP

Um die Groß-und Kleinschreibung zu übergehen, nutzt man den Schalter
Code:
(?i)
Das heißt
Code:
(?i)http|https|ftp
findet http oder https oder ftp oder HTTP oder HTTPS oder FTP oder sämtliche anderen Mischvarianten.

Das kann man etwas verkürzt schreiben
Code:
(?i)[h|f]tt?ps?
Der Ordnung halber (und um Varianten wie http-Protokoll auszuschließen) nehme ich jetzt noch den Doppelpunkt und einen Slash mit in den Suchvorgang auf
Code:
(?i)[h|f]tt?ps?:/
Jetzt gibt es noch Adressen ohne vorangehendes Protokoll. Diese www-Adressen müssen also gefunden werden, auch wenn sie alleine stehen. Und den folgenden Dot nehmen wir auch wieder mit in die Suche auf. Der Dot ist allerdings ein Sonderzeichen, das im Grep mit einem Backslash escaped werden muss, damit wirklich nur ein Dot gefunden wird.
findet www.

Zusammen geschrieben ergibt das
Code:
(?i)([h|f]tt?ps?:/|www\.)
oder IMHO etwas besser
Code:
(?i)([h|f]tt?ps?:/|w{3}\.)
Jetzt fehlen noch die nachfolgenden Zeichen. Und eine Gemeinsamkeit haben die Internetadressen: Es sollten keine Leerzeichen, Absatzschaltungen bzw. Tabulatoren vorhanden sein. Sind Leerzeichen vorhanden, dann werden sie zumeist als %20 interpretiert. Das Suchzeichen für alle Zeichen, die kein Leerzeichen, Absatzschaltung oder Tabulator sind lautet \S

Dieses (Nicht-)Zeichen wird mittels + so oft gesucht, bis es auf sein Pendant: ein Leerzeichen, eine Absatzschaltung oder einen Tabulator trifft.
Code:
(?i)([h|f]tt?ps?:/|w{3}\.)\S+
Allerdings sind Satzzeichen für \S ebenfalls Zeichen, die gefunden werden. Deshalb muss man diese ausschliessen, indem man dem Grep sagt \S bis zum Wortende \>
Code:
(?i)([h|f]tt?ps?:/|w{3}\.)\S+\>
Und zum Schluss ergänzt du noch die eventuell am Url-Ende auftretenden Unterstriche, Doppelpunkte und oder Slashes
Code:
(?i)([h|f]tt?ps?:/|w{3}\.)\S+\>[:/_]*
sollte somit für die allermeisten Zwecke vollauf ausreichendend sein.

Ich habe den Grep jetzt nicht weiter getestet, da er logisch erscheint. Von daher möchte ich keine Aussage zu eventuellen falsch-falschen oder falsch positiven Fundstellen treffen. Und ich habe keine Plausibilitätsprüfung eingebaut. Es würden also auch „unsinnige“ Zeichenfolgen gefunden werden, sobald sie auf http:/, https:/ ftp:/ oder www. folgen. Das dürfte allerdings in einem realen Dokument mit realen Internetadressen kaum der Fall sein.
;)


Ich bin mir auch sicher, dass du mir demnächst ein ausgiebiges Feedbeck zu diesem Thema geben wirst.

;)





.
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Jetzt hab ich mich immer mal nebenbei mit deinem Post beschäftigt.

Einen ganz lieben Dank für die Aufschlüsselung. Kurz, knackig und hervorragend nachvollziehbar.
Da fanden sich dann auch wieder einige Wissensbrocken aus der Informatik und dem was noch vom Grundlagenseminar Logik hängen geblieben war im Köpfchen ein :)

Auf jeden Fall hat es mich jetzt wieder intensiver auf die Schiene gesetzt, zu gucken wo und wie sich ID mit Automatisierungen noch ausreizen lässt, nicht nur im Layout. Momentan sitz ich an einer wissenschaftlichen Arbeit und schreib diese auch direkt in ID rein und gerade was die Verknüpfung von Bibliographie und Fußnotentexten angeht kommt mir das garnicht zu Unrecht, wenn man statt elend langer Titelverweise von Hand mit Kürzeln und Ergänzungen arbeiten kann. Ist ja dann auch wesentlich weniger Fehler anfällig. Man heißt ja nicht Guttenberg :)

Und jetzt sitz ich immer wieder da und versuch mir das Vokabular zu verinnerlichen (immer schön die Liste mit den Metazeichen in Reichweite).
Hast du eventuell eine Literaturempfehlung, was Grep angeht. Mein jetztiges Wissen speist sich aus "InDesign CS5: Das Profihandbuch" und der video2brain DVD zu ID CS5, aber da wird das Thema, denke ich mal, vergleichsweise nur angerissen.
 
AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Hmmh, Literatur. Da musst du leider jemand anderes fragen.

Ich halte Grep eher für eine Sammlung von Vokabeln. Und wenn du diese Vokabeln oder besser Metazeichen beherrscht, dann kannst du eigentlich auch schon die Sprache. Und da ist Grep extrem flexibel.

Denn deinem Grep ist es prinzipiell egal, ob du sagst: „das Geräusch von an der Wasseroberfläche zerplatzenden Luftbläschen“ oder einfach nur „blubb blubb“
:D

Es gibt auch keinen guten oder schechten Grep. Der eine findet alles vielleicht etwas schneller als der andere und eventuell gibt es bei manchen noch falsch falsche oder falsch positive Ergebnisse. Und im Zweifel gibt es immer einen noch kürzeren oder einen noch exakter auf die zu findenden Stellen zugeschnittenen Grep.

Ich selbst habe meine (leider immer noch bescheidenen) Grep-Kenntnisse auch nur durch Mitlesen von Grep-Diskussionen und durch eigenen Trial-&-Error aufgebaut.
 

grafik_avd

Tier mit Falls-Beutel

AW: Kann man den Umbruch von Zeichenfolge/URLs automatisiert verhindern

Denn deinem Grep ist es prinzipiell egal, ob du sagst: „das Geräusch von an der Wasseroberfläche zerplatzenden Luftbläschen“ oder einfach nur „blubb blubb“
:D
Wie bei der meisten Kommunikation - ein formales Ding, man muss sich nur auf das System einigen.

Ich selbst habe meine (leider immer noch bescheidenen) Grep-Kenntnisse auch nur durch Mitlesen von Grep-Diskussionen und durch eigenen Trial-&-Error aufgebaut.

Dann bin ich da , wohl auch nicht so falsch unterwegs...

blubb blubb :D
 
Bilder bitte hier hochladen und danach über das Bild-Icon (Direktlink vorher kopieren) platzieren.
Antworten auf deine Fragen:
Neues Thema erstellen

Willkommen auf PSD-Tutorials.de

In unseren Foren vernetzt du dich mit anderen Personen, um dich rund um die Themen Fotografie, Grafik, Gestaltung, Bildbearbeitung und 3D auszutauschen. Außerdem schalten wir für dich regelmäßig kostenlose Inhalte frei. Liebe Grüße senden dir die PSD-Gründer Stefan und Matthias Petri aus Waren an der Müritz. Hier erfährst du mehr über uns.

Stefan und Matthias Petri von PSD-Tutorials.de

Nächster neuer Gratisinhalt

03
Stunden
:
:
25
Minuten
:
:
19
Sekunden

Flatrate für Tutorials, Assets, Vorlagen

Statistik des Forums

Themen
118.635
Beiträge
1.538.477
Mitglieder
67.559
Neuestes Mitglied
hanuta
Oben