Archiv

Archiv für die Kategorie ‘Websites & Technik’

WordPress Permalinkstruktur repariert…

WordPress LNX-WORLD liefert 404 Fehler
Ich hatte in den letzten Tagen immer wieder 404 Fehlerseiten in der Auslieferung meines Contents, da ich die Linkstruktur meiner Artikel geändert hatte… Dies sollte nun der Vergangenheit angehören. Alle Artikel sind wieder unter der “alten” URL sowie unter der neuen zu erreichen (Die alte URL wird per 301 Weiterleitung auf die neue URL umgeleitet, der SEO Gedanke wird auch hier verfolgt)! Sehr geholfen hat mir hier der Artikel von Dean Lee

SEO: Google verwendet keine Keyword META Tags

Google verwendet in der Tat, wie lange zuvor schon vermutet, keine Keyword META-Tags in den Suchergebnisseiten, es sei denn mittels der Suchanfrage wurde explizit Keyword Metatags verwendet.
Anbei auch gleich mal das Video von Google, in dem genau erklärt wird wieso und welche Metatags tatsächlich Verwendung finden.

robots.txt – was ist das, brauch man das?

Was macht eine robots.txt?
Eine robots.txt, platziert im root-Verzeichnis einer Domain, sagt den verschiedensten Webcrawlern und Spidern der Suchmaschienen welche Seiten dieser Domain in den Index der jeweiligen Suchmaschiene aufgenommen werden dürfen, bzw. welche nicht.

Wozu brauch ich das?
Man kann auf diesem Wege beispielsweise dafür sorgen, das das Impressum einer Webseite, oder das Administrative Backend (bei WordPress /wp-admin/ oder bei Typo3 /typo3/) nicht bei Google in den Suchergebnissen auftaucht. Ebenso kann man mittels der robots.txt dem Webcrawlern mitteilen, das nur die jeweils ersten Seiten einer Webseite gecrawlt werden sollen, weitere Unterseiten nicht. Auch kann man hierrüber bestimmen, ob die Bilder, welche auf der Seite sind, im Bildindex bei Google auftauchen dürfen, oder eben nicht.

Was bedeutet die Fehlermeldung File does not exist: /var/www/virtual/mydomain.com/htdocs/robots.txt ?
Diese Fehlermeldung sieht man in seinem Apache Logfile, wenn man keine robots.txt im angegebenen Verzeichnis liegen hat und dieses das “Quellverzeichnis” der Webseite ist. Verursacht wird die meldung durch einen Webcrawler, beispielsweise dem Googlebot, welche jede Webseite immer wieder nach einer robots.txt absuchen. Wenn die Datei nicht verhanden ist, liefert der Apache Webserver natürlich eine Fehlermeldung an den Crawler und schreibt diesen Eintrag in das Logfile. Wenn man also lediglich diese Fehlermeldung loswerden möchte, dann sollte man einfach eine leere robots.txt im entsprechendem Verzeichnis ablegen.

Beispiele für robots.txt Dateien – Alles erlaubt
Im erstem Beispiel wird über eine robots.txt alle Webcrawleren etc. der volle Zugriff auf die gesamte Webseite erlaubt. Inklusive aller Unterseiten und aller Bilder.

# Ganze Site freigeben
User-agent: *
Disallow:

User-agent: gibt an, für welchen Robot die Regel gelten soll, mit dem Sternchen gilt diese Einstellung für alle Robots. Anstelle eines Allow: * schreibt man für eine Freigabe ein Disallow: ohne Angabe was verboten ist, somit ist alles freigegeben. Wer mag darf natürlich auch Allow: * schreiben…

Beispiele für robots.txt Dateien – Alles verboten
Ich habe es schon einige male erlebt, das Seiten, welche ich noch in der Entwicklung hatte, schon bei Suchmaschienen im Index standen. Für Entwicklungszwekce kann es also auch ganz sinnig sein, wenn man nicht alles erlaubt, sondern im Gegenteil, alles untersagt. Dazu muss lediglich ein “/” bei Disallow: ergänzt werden:

# Ganze Site sperren
User-agent: *
Disallow: /

Beispiele für robots.txt Dateien – WordPress Backend verbieten
Um nur ein Verzeichnis (oder mehrere) vom indizieren auszuschließen, muss man dieses Verzeichnis explizit ausschließen, oder, alternativ, alles sperren bis auf die Verzeichnisse und Dateien die auftauchen sollen:

# Alles freigeben bis auf das WordPress Backend
User-agent: *
Disallow: /wp-admin/

Speziell nur eine Datei freigeben:

# Nur die Indexseiten freigeben
User-agent: *
Disallow: /
Allow: /index.php

Beispiele für robots.txt Dateien – Eine Datei sperren
Warum sollte man nur eine Datei sperren? Nun, bei Seiten, welche sich häufig ändern macht es wenig sinn, wenn diese mit “alten” Inhalten im Suchmaschienenindex landen. Ein Beispiel dafür wären News Seiten. Nichts ist älter als die Zeitung von gestern, oder?

# Nur die Newsseite sperren, da diese sich täglich ändert
User-agent: *
Disallow: news.php

Beispiele für robots.txt Dateien – Keiner ausser Google
Wahre Googlefans wollen vielleicht das ihre Seiten exklusiv für Google zur Verfügung gestellt werden. Das lässt sich auch bewerkstelligen:

# Hier die drei Googlebots erlauben
User-agent: Googlebot
Disallow:
User-agent: Googlebot-Image
Disallow:
User-agent: Mediapartners-Google
Disallow:
# Hier den Rest aussperren
User-agent: *
Disallow: /

Beispiele für robots.txt Dateien – Alles ausser Google Bildersuche
Die Gefahr des Diebstahls geistigen Eigentums ist im Internet extrem hoch. Speziell Bilder werden oftmals einfach “geklaut”. Die meisten werden obendrein über die Google Bildersuche fein sortiert angeboten. Im Normalfall weniger schlimm, jedoch ab und zu sind ein paar Spezialisten darunter, welche die Bilder einfach nur auf Ihren Seiten verlinken, sprich nicht einmal selber hosten und den ganzen Traffic auch noch auf anderen Seiten lassen. Diese Art ist dann quasi doppelt illegal… Um solche Leuten den Diebstahl zumindest etwas schwerer zu machen, oder einfach nur um die Bilder des letzten Familienausfluges nicht im Googlebilderindex wiederzufinden, kann man natürlich den Gooblebot für die Bildersuche aussperren:

# Google Bildersuche aussperren
User-agent: Googlebot-Image
Disallow: /
# Hier den Rest aussperren
User-agent: *
Disallow:

HINWEIS:
Alle diese Maßnahmen in der robots.txt sind natürlich kein hundertprozentiger Schutz, aber die meisten Robots halten sich an die Regeln, welche ihnen über die robots.txt mitgeteilt werden. Und menschliche Benutzer lassen sich hiermit garnicht aufhalten, oder haben Sie zuerst meine robots.txt gelesen und anschließend erst diesen Artikel?

Weblinks
Hier noch ein paar nette Links zu diesem Thema, unter anderem eine recht umfangreiche Liste von Webcrawlern/Robots:


ZOCKEN BIS DER ARZT KOMMT!

MySQL per Konsole – Datenbank Dump erstellen

Eine Sicherungskopie (Dump) der laufenden MySQL Datenbanken zu erstellen, sollte zu den alltäglichen Aufgaben eines jeden Datenbankadministratoren gehören. Datenbank Administratoren sind oft auch Betreiber von Root Servern, leider wird dieses Backup gerade bei denen gern vergessen…
Es geht dabei doch so einfach… Man nehme einfach nachfolgende Kommandozeile:

# mysqldump --databases –opt -Q -uroot -pTopSecretKennwort Datenbank1 | gzip -9 > Datenbank1.sql.gz

MySQLHierbei passiert folgendes:

Zuerst geben wir an, das wir einen Dump einer Datenbank erzeugen wollen und verwenden hierzu das Bordmittel der MySQL, den Befehl mysqldump. Mit der Angabe von –databases geben wir an das wir Datenbanken exportieren, also dumpen, möchten. Die Parameter –uroot und –pTopSecretKennwort sollten sich ja eigentlich von selbst erklären.
Datenbank1 sei hier die zu exportierende Datenbank, wobei es mit diesem Kommando möglich ist mehr als eine Datenbank auf einmal zu exportieren.
Über eine Pipe (|) geben wir die Bildschirmausgabe StdOut an GZip weiter, da wir ja einen komprimierten Dump wollen, die Ausgabe von gzip wiederum wird in einen Datei umgeleitet, damit wir die Daten nicht nur auf den Bildschirm bekommen. Fertig!



1 von 3 iPhones gewinnen!

KategorienMySQL Tags: , , , ,

MySQL per Konsole – Neue Datenbank und einem Benutzer volle Rechte darauf geben

MySQLWie man per Konsole einen neuen Benutzer in der MySQL anlegen kann, hatte ich schon beschrieben. Leider darf dieser User von sich aus so nichts. Ganz nebenbei fehlt ja auch die Datenbank in der beispielsweise das WordPress laufen soll…
Also legen wir nun eine Datenbank an und geben unserem Benutzer im gleichem Arbeitsgang volle Rechte auf diese Datenbank:

$ mysql -p -u root
CREATE DATABASE data-base;
USE data-base;
GRANT ALL ON data-base .* TO db-user@localhost IDENTIFIED BY 'PASSWORD_CHANGE_ME';
FLUSH PRIVILEGES;
exit;

Sieht einfach aus, ist es auch…

Zuerst der Login als Benutzer Root mit Kennwort (mysql -p -u root). Nach der Eingabe des Root Kennwortes (das für MySQL, nicht unbedingt das für die Konsole) folgt auch schon das MySQL Kommando zum erstellen der Datenbank, in diesem Fall “DATA-BASE” (CREATE DATABASE data-base;). Da die Rechte für diese Datenbank auch gleich angepasst werden sollen, wechselt man nun erstmal in diese Datenbank (USE data-base;) – nun werden die vollen Zugriffsrechte gesetzt (GRANT ALL ON data-base .* TO db-user@localhost IDENTIFIED BY ‘PASSWORD_CHANGE_ME’;) welcher das Kennwort “PASSWORD_CHANGE_ME” hat und sich nur von localhost aus anmelden darf (@localhost) wenn er Zugriff auf diese Datenbank haben möchte. Abschließend die Rechte noch “updaten” (FLUSH PRIVILEGES;) und die MySQL Konsole verlassen (exit;).


Premium-Template.com

KategorienMySQL Tags: , , ,