Size

(deutsche Übersetzung der Seite PmWiki.{{Size}}, Stand 31.08.2004)

Q: Was ist das größte PmWiki wenn man die Zahl der Seiten betrachtet?

Pm: Natürlich gibt es — aufgrund der Art und Weise, wie PmWiki die Seiten organisiert — keine theoretische Grenze für die Zahl der Seiten.

Die praktische Grenze ist die Zahl der Dateien, die in einem einzelnen Verzeichnis (wiki.d) organisiert werden können und die Zeit, die das Durchsuchen der Seiten benötigt. Um ein paar Referenzpunkte heranzuziehen: Das SciTechWiki (http://www.sci.tamucc.edu/wiki) hat derzeit 1649 Seiten und das TAMUCC Wiki (http://www.tamucc.edu/wiki) hat mehr als 4500 Seiten. Beide Wikis scheinen ohne irgendwelche Probleme zu laufen; sogar Suchanfragen scheinen nicht besonders lange zu dauern. Beide Wikis laufen unter Red Hat-Linux. Ich weiß, dass mir unter einem Red Hat-Linux einige Verzeichnisse mit mehr als 5000 Dateien (Verzeichnisse mit Maillinglisten-Archiven) keine größeren Schwierigkeiten bereiten, insofern denke ich nicht, dass das Betriebssystem eine Beschränkung für PmWiki darstellt (jedenfalls nicht hinsichtlich der Zahl der Seiten).

Während der Entwicklung von PmWiki habe ich über diese Probleme nachgedacht — hier sind die Entscheidungen, die ich bisher getroffen habe: Erstens habe ich, um Beschränkungen durch Verzeichnisgrößen zu umgehen, die Variablen $PageFileFmt, $Wiki Dir und $WikiLibDirs verwendet, so dass der Administrator die verschiedenen Dateien in eine andere Struktur als einfach "@@wiki.d/Group.Pagename@@" bringen kann. Beispielsweise könnte $Page File Fmt in “$Group/$Title_” oder "$Group/$PageName" geändert werden, so dass Dateien als “wiki.d/Group/Pagename” oder “wiki.d/Group/Group.Pagename” abgespeichert würden — beides würde die Gesamtzahl von Dateien in einem einzelnen Verzeichnis verringern. Irgendwie müssten trotzdem noch die Verzeichnisse für die verschiedenen Gruppen erzeugt werden, dies ist aber kein großes Problem. Selbst wenn dieser Ansatz nicht genug bringt (z.B. bei einer einzelnen Gruppe mit Tausenden von Seiten), gibt es noch weitere Optionen. Mit einer Reihe kleiner Ergänzungen lassen sich die Dateien etwa abhängig vom ersten Buchstaben des Seitentitels in Verzeichnissen organisieren, wie etwa “wiki.d/P/Group.Pagename” und “wiki.d/W/Group.WikiWord”. Auch dies würde die Last auf mehrere Verzeichnisse verteilen.

Abgesehen davon könnte ich natürlich relationale Datenbanken oder andere Indizierungsmöglichkeiten nutzen, sofern dies notwendig wird. Allerdings bevorzuge ich die Einfachheit und dies ist definitiv eines der Gebiete, wo ich es vermieden habe, ein überflüssiges Feature zu verwenden. Lieber wähle ich einen einfachen Ansatz und ersetze ihn erst dann durch eine komplexe Lösung, wenn die Notwendigkeit offenkundig wird — dann sind die realen Parameter des Problems auch besser bekannt. Ich bin sehr zuversichtlich, dass es gegebenenfalls einfach sein wird, einen Migrationspfad vom bestehenden Organisationsschema auf ein neues Modell zum Organisieren der Seiten zu entwickeln.

Anmerkung: Search Wiki wird zunehmend komplizierter in dem Maße wie PmWiki wächst. Fortgeschrittene Suchfunktionen werden zu PmWiki hinzugefügt. Wenn die Suchfunktionen von PmWiki nicht mehr ausreichen sollten, wäre es viel effektiver, auf bestehende, ausgereifte Indizierungssysteme zurückzugreifen als zu versuchen, diese Funktionalität in PmWiki zu duplizieren.



This page may have a more recent version on pmwiki.org: PmWiki:Size, and a talk page: PmWiki:Size-Talk.