Unter Schirmherrschaft von
Factory Seven Media & Consulting
running-cool.de
   X   

[Krankheiten von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Medikamente von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Diagnostik & Laborwerte von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Therapieverfahren von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Gesundheitsthemen von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Symptome von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   
Suche

running-cool: never change a running system

Das Comprehensive Perl Archive Network

CPAN (engl. Comprehensive Perl Archive Network) ist ein weltweit gespiegeltes Online-Repository für Perl-Module, -Anwendungen und Dokumentationen, das am 25. Oktober 1995 in Anlehnung an die TeX-Library CTAN ins Leben gerufen wurde und sich schnell zum Perl-de-facto-Standard entwickelt hat. Es bietet die Möglichkeit einer komfortablen Installation und Verwaltung von Perl-Modulen. Heute umfasst das CPAN circa 230 Server auf fünf Kontinenten und enthält über 17.000 Distributionen von über 7.200 Autoren, was einem Volumen von annähernd 4,9 GB entspricht.

Installierte Perl-Module

Eine schnelle Übersicht aller installierten Perl-Module erfolgt mit Hilfe des Arrays @INC. Dieses Array erhält alle Pfade, in denen der Perl-Interpreter nach Modulen sucht. Es muss nur das @INC-Verzeichnis nach Perl-Modulen durchsucht werden. Die Suche erfolgt dabei nach der Dateiendung .pm.

Libraries for WWW Access in Perl (LWP)

Unter dem Synonym LWP (Libraries for WWW Access in Perl, libwww-perl) versteckt sich eine mächtige Bibliothek von Perl-Modulen, die verschiedene Schnittstellen, Funktionen und Objekte zum Ansprechen von Web-Diensten und Internet-Protokollen zur Verfügung stellt. LWP besitzt insgesamt acht separate Modulgruppen: File, Font, HTML, HTTP, LWP, MIME, URI und WWW.

Die Stärke der LWP-Bibliothek liegt dabei in der Request-/ Response-Interaktion zwischen Client und Server. Typischerweise wird LWP bei der Programmierung von Web-Bots, Crawlern, Spidern, Browsern, oder allgemeiner ausgedrückt beim automatisierten Webseitenaufruf eingesetzt.

HTML::TreeBuilder

HTML::TreeBuilder ist eine Sub-Klasse zu HTML::Parser (und HTML::Element), die es ermöglicht, ein HTML-Dokument in eine aus HTML::Element-Objekten und Strings bestehende Baum-Struktur zu zerlegen, die sodann mit verschiedensten Methoden bequem durchsucht, ggf. verändert und z.B. wieder als HTML-Dokument ausgegeben werden kann.

Das Perl-Modul HTML::TreeBuilder erzeugt aus einem Webdokument einen Baum von HTML-Elementen.

HTML::Parser

Das Parsen von HTML-Seiten mit Regulären Ausdrücken besitzt seine Tücken und ist für Programme mit einem generischen, umfassenden Ansatz nicht zu empfehlen. Das Hauptproblem bei den Regulären Ausdrücken ist, dass sich komplexe Strukturen nur sehr schwer und umständlich abbilden lassen. Diese Ausdrücke sind zudem nicht sehr robust gegenüber kleinsten Veränderungen in der Zieldatei. Auf den Punkt gebracht kann man sagen, dass HTML-Code in Webseiten nicht regulär genug ist, um mit Regulären Ausdrücken flexible und effektive Perl-Scripte zu entwicklen.

Ein wesentlich eleganterer und deutlich robusterer Ansatz zum parsen von HTML-Seiten lässt sich mit dem CPAN-Modul HTML::Parser realisieren.

Inhaltsverzeichnis Top
Wir benutzen Cookies

Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell für den Betrieb der Seite, während andere uns helfen, diese Website und die Nutzererfahrung zu verbessern (Tracking Cookies). Sie können selbst entscheiden, ob Sie die Cookies zulassen möchten. Bitte beachten Sie, dass bei einer Ablehnung womöglich nicht mehr alle Funktionalitäten der Seite zur Verfügung stehen.