Hilfe:Kategorien/Sortierung

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Diese Hilfeseite erläutet, wie die Reihenfolge aufgelisteter Seiten in einer Kategorie beeinflusst werden kann.


Icon
Icon
Inhaltlich-enzyklopädische Fragen zu bestimmten Sachgebieten werden unter Wikipedia:Kategorien/Sortierung behandelt.


Wenn alle Seiten aufgelistet werden, die in eine Kategorie fallen, wird eine bestimmte Reihenfolge beachtet. Weil es Zehntausende von Seiten in einer Kategorie geben kann und man schnell den Überblick verlieren würde, gibt es technische und projektseitige Regeln, an welcher Stelle jede Seite einsortiert wird.

Festlegen des Sortierschlüssels[Bearbeiten | Quelltext bearbeiten]

Jeder Seite als Ganzes, aber auch in jeder einzelnen Kategorie kann ein Sortierschlüssel zugeordnet werden.

Vorgabe: Name der Seite[Bearbeiten | Quelltext bearbeiten]

Die Sortierung innerhalb der Auflistung richtet sich zunächst nach dem Seitentitel.

  • „Seitentitel“ ist der Teil des Seitennamens, der auf die Angabe eines „Namensraums“ folgt. Hier auf dieser Seite wäre der Seitentitel Kategorien/Sortierung.
  • Bei enzyklopädischen Artikeln sind Seitentitel, Seitenname und Lemma identisch.
  • Sollte der kuriose Fall auftreten, dass in einer Kategorie Seiten gleichen Seitentitels aus verschiedenen Namensräumen auftreten, wird offenbar untereinander nach der Nummer des Namensraums sortiert.

Zuordnung eines Standardsortierschlüssels[Bearbeiten | Quelltext bearbeiten]

Es kann Gründe geben, diese Standardsortierung zu verändern, also in allen Kategorien statt des Seitentitels einen anderen Begriff vorzugeben.

In solchen Fällen wird das Syntaxelement {{SORTIERUNG:}} (alternativ auch {{DEFAULTSORT:}}) verwendet.

  • Es wird im Quelltext in der Regel direkt vor die Kategorien gestellt.
  • Nach dem Doppelpunkt folgt die Zeichenkette, die die gewünschte Anordnung erzeugen soll, also der Standardsortierschlüssel:
    {{SORTIERUNG:Mein Standardschlüssel}}
  • Mehr als eine solche Deklaration sollte nicht in einer Seite wirksam werden, weil das Ergebnis nicht vorhersagbar ist und zukünftig auch Warnungen der Software auslösen kann.
  • Der für eine Seite letztlich wirksame Standardschlüssel ist in den Basisinformationen der Seiteninformationen nachlesbar.

Expliziter Schlüssel für eine einzelne Kategorie[Bearbeiten | Quelltext bearbeiten]

In jeder einzelnen Kategorie-Deklaration kann ein eigener (abweichender) Sortierschlüssel vorgegeben werden.

Dazu wird hinter die Kategorie-Bezeichnung ein Pipe-Symbol | und dann der gewünschte Sortierschlüssel geschrieben:

[[Kategorie:XY|vom Lemma abweichende Sortierung]]

Damit wird für diese einzelne Kategorie die Standardsortierung außer Kraft gesetzt.

Abfolge der Sortierschlüssel[Bearbeiten | Quelltext bearbeiten]

Zur Sortierung wird seit 2017 der „UCA“ verwendet, ein komplexer aber komfortabler Sortieralgorithmus.

Bis Anfang 2017 wurde einfach nach dem Unicode-Wert jedes Zeichens des Sortierschlüssels angeordnet. Das brachte jedoch verschiedene Ungereimtheiten mit sich, denen aufwändig manuell entgegengearbeitet werden musste.

Die grundlegende Folge der Seiten richtet sich nach folgenden Gruppen von Zeichen im Sortierschlüssel:

  1. Sonderzeichen, also Leerzeichen und Satzzeichen aller Art
  2. Zahlen, also eine Gruppe von Ziffern
  3. Buchstaben auf Basis des lateinischen Alphabets
  4. Buchstaben anderer Alphabete und andere Schriftsysteme
  5. Symbole; etwa mathematischer und grafischer Art

Sonderzeichen[Bearbeiten | Quelltext bearbeiten]

Zu den Sonderzeichen, die vor allen Zahlen und Textzeichen einsortiert werden, gehören:

  1. Leerzeichen (geht allen anderen Zeichen voran[1])
    • Möglicherweise auch andere Ausprägungen (spezielle Breiten), die jedoch nicht bedeutungstragend verwendet werden sollen.
  2. Satzzeichen; also Punkt und Komma, Ausrufe- und Fragezeichen; Klammern aller Art, Anführungszeichen in allen Varianten, horizontale Striche aller Art einschließlich Bindestrich.
  3. elementare Rechenzeichen (Plus, Minus usw.), das Paragraphenzeichen §
  4. Das Zeichen #, das oft für eine besondere Bevorzugung eines Textsegments eingesetzt wird.

Bis Anfang 2017 standen typografische Zeichen wie der Halbgeviertstrich mit einem Code von 8211 weit hinter den ASCII-Zeichen mit Codes bis 126; innerhalb der ASCII-Tabelle manche Sonderzeichen vor den Ziffern, zwischen Ziffern und Buchstaben, zwischen Groß- und Kleinbuchstaben. Das ist nunmehr aufgehoben, und während früher Sonderzeichen wegen ihrer mühsam vorherzusagenden Position in den Sortierschlüsseln generell verpönt waren, bereiten sie jetzt weniger Probleme.

Unmittelbar aufeinander folgende Sonderzeichen werden einzeln ausgewertet und nicht als Gruppe.

Innerhalb der Sonderzeichen gibt es eine gewisse und konstante Abstufung. Diese sollte jedoch nicht ausgenutzt werden, außer dass das Leerzeichen am Anfang steht und danach alle anderen Sonderzeichen folgen.

Zahlen[Bearbeiten | Quelltext bearbeiten]

Wenn innerhalb des Sortierschlüssels eine Gruppe von Ziffern (0 bis 9) angetroffen wird, so wird diese ganze Gruppe nach ihrem numerischen Wert als Ganzzahl sortiert.

Bis Anfang 2017 wurde jede Ziffer einzeln sortiert („lexikalisches Prinzip“). Das bedeutete, dass eine „1“ zu Beginn vor einer „5“ am Anfang sortiert wurde, etwa wie bei den nachstehenden Autobahnen:

  1. A 100
  2. A 54

Heute wird die gesamte Zifferngruppe numerisch sortiert, also zuerst 54, dann 100.

Die Regel würde in entsprechend konfigurierten Wikis auch für Ziffern anderer Schriftsysteme gelten, die wir jedoch nicht verwenden.

Lateinische Buchstaben[Bearbeiten | Quelltext bearbeiten]

Bei den Buchstaben werden die Variationen eines Grundbuchstabens als „fast gleich“ betrachtet, während der nachfolgende Buchstabe ein stärkeres Gewicht hat als diese Varianten zueinander.

Das bedeutet für das Wort „über“:

  • Alle Variationen von „U“, wie „u“, „ü“, „û“, „ú“, „Ü“ etc. bleiben beisammen.
  • Ausschlaggebend ist zunächst der folgende Buchstabe; hier also „b“ oder „B“.
  • Damit wird „über“ nahe „Uber“ und vor „ubis“ eingeordnet.

Bis Anfang 2017 wäre ein „ü“ mit einem Code von 252 weit hinter einem „u“ oder „U“ mit Codes von 117 bzw. 85 sortiert worden; auf jeden Fall erst nach „Z“ mit einem Code von 90.

Die Variationen, zu denen auch „ø“ gehört, haben untereinander eine feste Anordnung:

  • Grundbuchstabe vor modifizierten Formen, etwa durch diakritische Zeichen
  • alle Variationen des Kleinbuchstabens vor den Großbuchstaben
  • Feste Reihenfolge der Modifikationen, die jedoch für unsere Zwecke keine Rolle spielen.

Sonderfälle:

  • „ß“ wird als „ss“ sortiert.
  • Die Ligaturen wie Æ, IJ, Œ werden als zwei Einzelbuchstaben sortiert.

Buchstaben anderer Schriften[Bearbeiten | Quelltext bearbeiten]

Nach den auf lateinischen Grundbuchstaben basierenden Buchstaben werden Zeichen aus anderen Schriften einsortiert.

Für die deutschsprachige Wikipedia ist das meist weniger relevant, da unsere Seiten einen Namen auf Basis des lateinischen Alphabets tragen. Allerdings kommen gelegentlich einzelne Zeichen aus anderen Alphabeten vor, etwa ein μ für „Mikro“ oder α, β, Ω usw.

  • Eine Besonderheit ist auch das Þ (thorn) aus dem Isländischen, das nicht als lateinischer Buchstabe zählt (Рund ð werden jedoch als „D“ erkannt).

Wenn für eine fremde Schrift eine Unterscheidung zwischen Groß- und Kleinbuchstaben oder aber diakritische Zeichen definiert sind, dann gelten ähnliche Detailregeln wie bei lateinischer Schrift.

Symbole[Bearbeiten | Quelltext bearbeiten]

Im mathematischen Bereich, aber auch mit grafischer Bedeutung gibt es zahllose Symbole. Anders als Sonderzeichen, die höchstens im grammatikalischen Kontext einen Sinn ergeben, haben sie eine eigenständige Bedeutung, wie etwa auch ein japanisches Schriftzeichen. Währungssymbole wie Dollar- und Eurozeichen gehören ebenfalls dazu. Sie werden nach den Textzeichen einsortiert.

In der Auflistung der Seiten einer Kategorie wird in Abschnitte gegliedert. Diese richten sich nach dem ersten Zeichen des Sortierschlüssels. Solche Abschnitte sind regelmäßig, sofern entsprechende Seiten kategorisiert wurden:

  1. Leerzeichen (keine sichtbare Überschrift).
  2. einzelne Sonderzeichen (insbesondere ! und auch # treten häufiger auf).
  3. Zahlen, unter der Überschrift „0–9“.
  4. Bis zu 26 lateinische Grundbuchstaben.
  5. Buchstaben anderer Schriften und Symbole.

Diskussionsseiten[Bearbeiten | Quelltext bearbeiten]

Diskussionsseiten werden nicht gesondert kategorisiert, und sie erhalten auch keine eigenen Sortierschlüssel.

In anderen Wikis kann die Sortierung anders konfiguriert sein; insbesondere auch aus sprachlichen Gründen abweichen. Außerdem könnte die konventionelle Reihenfolge nach dem Unicode-Wert jedes Zeichens weiterhin herangezogen werden.

Standardsortierung[Bearbeiten | Quelltext bearbeiten]

  1. Ein Artikel mag heißen:
    Liste der Opern von Wolfgang Amadeus Mozart.
  2. Die Wikipedianer entscheiden sich zu folgender Vorgabe als Standardsortierung:
    {{SORTIERUNG:Oper, Mozart, Wolfgang Amadeus}}
  3. In einer Einzelkategorie mag gesetzt werden:
    [[Kategorie:Oper nach Komponist|Mozart, Wolfgang Amadeus]]

Die Zuweisung (2.) setzt die Sortierung nach dem Artikelnamen unter „L“ außer Kraft. Der Artikel erscheint nun jeweils unter „O“. Die Einzelkategorie wird hingegen nach ihrem individuellen Schlüssel (3.) bei „M“ einsortiert.

  1. nur das vorherige Ende des Schlüssels würde noch früher eingeordnet werden