charset in HTML5

Hier können allgemeine Fragen zu HTML und CSS gestellt und diskutiert werden.
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

dutch hat geschrieben:Ja, in der XML Datei steht:

Code: Alles auswählen

<?xml version="1.0" encoding="utf-8"?>
Ok, es steht also drin. Ist es denn auch UTF-8?

$output_encoding hin, $output_encoding her, es wäre erst mal wichtig zu erkennen, was reinkommt bevor man versucht es auszugeben. Es geht ja wohl um irgendeinen für alle anderen völlig unbekannten RSS-Feed, daher musst Du das schon selbst feststellen.

Hast Du den Feed auch mal mit einem anderen Tool wie mod_cpo_news getestet?
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Ich habe die Frage an den Herausgeber des feed weitergegeben.
Ich dachte in meiner Einfalt, dass das Magpie script egal was reinkommt umwandelt und als ISO-8859-1 ausgibt.
Aber da habe ich wohl zu naiv gedacht :lol:

Gruß,
dutch
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

Wird der Feed beim direkten Aufruf mit dem Browser denn als News-Seite oder als XML-Code dargestellt?

Was kriegst Du denn, wenn Du einfach den nackten Code verwendest?

Code: Alles auswählen

<?php
require('rss_fetch.inc');
$url = 'http://diegeheimeURL.tld/feed.xml';
$rss = fetch_rss($url);
echo "Site: ". $rss->channel['title']. "<br>
";
foreach ($rss->items as $item ) {
	$title = $item[title];
	$url   = $item[link];
	echo "<a href=$url>$title</a></li><br>
";
}
?>
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Der code kommt als XML an, generiert aus einem Joomla RSS-Modul, und er ist alles andere als 'geheim' ;)

Das ist der feed, um den es geht:

http://communicatie.ebg.nl/feed/dtdu?fo ... d&type=rss

Gruß,
dutch
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

Hm, UTF ist es wohl.

Komisch sind nur die Kommentare im Text, die von Google-RSS mit ausgegeben werden. Ob das so gedacht ist?
Dateianhänge
dagtekst.jpg
utf.jpg
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Bei mir werden die Kommentare nicht angezeigt... :?:

Was ich nicht verstehe ist, dass bei einem feed Umlaute normal ankommen (ü, ä, ö) aber ein Apostroph nur als Fragezeichen ausgegeben wird.

Beide, Umlaute und Apostroph, werden im feed direkt im Browser korrekt angezeigt. Nur wenn ich den feed dann auf der Website einbinde über das script, kommen Umlaute korrekt an aber der Apostroph nicht...
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

Wo siehst Du einen Apostroph?

Code: Alles auswählen

<![CDATA[<!-- START: Modules Anywhere -->
					<p class="dagtekst_tekst">Wie lieblich klingen die Schritte des Freudenboten auf den Bergen, der Frieden verkündet, der gute Botschaft bringt, der Rettung verkündet, der zu Zion spricht: Dein Gott ist König geworden!</p>
				<p class="dagtekst_bron">Jesaja 52,7</p>
				<p class="dagtekst_tekst leertekst_tekst">Tragt an euren Füßen als Schuhwerk die Bereitschaft für das Evangelium des Friedens.</p>
				<p class="dagtekst_bron leertekst_bron">Epheser 6,15</p>
		

<!-- END: Modules Anywhere -->]]>
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Sorry, der Apostroph stand im feed von gestern... ;)

Aber heute stehen in folgendem feed auch zwei Fragezeichen bei mir:

http://communicatie.ebg.nl/feed/dtnl?fo ... d&type=rss

Sind wohl typographische Anführungszeichen...?
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

Ich habe jetzt bald 1 Stunde mit Codierungen experimentiert. Kein Erfolg.

Vielleicht muss man den Autor mal ansprechen und ihn bitten auf solche Zeichen zu verzichten.
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Hallo Markus,

danke für deine Versuche.
Ich finde es nur komisch, dass es nur auf meiner ConPresso site falsch angezeigt wird. Auf der Joomla-Site von der es kommt, steht es richtig und wenn man den feed direkt im Browser öffnet auch...

Ich habe eher das Gefühl, dass die Welt eben jetzt weitgehend UTF-8 spricht und ConPresso leider nicht... :cry:

Gruß,
dutch
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

dutch hat geschrieben:Ich habe eher das Gefühl, dass die Welt eben jetzt weitgehend UTF-8 spricht und ConPresso leider nicht... :cry:
Ja, seitdem China das Maß aller Dinge ist muss UTF-8 gesprochen werden.
Latin1 war bestens geeignet um insbesondere viele Sprachen abzudecken, aber asiatische Schriftzeichen waren eben nicht dabei.

Vielleicht solltest Du einfach selbst ein Script schreiben, damit kannst Du dann eher auf solche Probleme reagieren.

Auch andere können mit diesem Feed nichts anfangen:
Klick
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Ich bin leider kein PHP-Programmierer ;)
Aber wenn andere CMS UTF-8 verstehen und dies auch als Default-Wert gesetzt wird in aktuellen PHP Versionen, ist es doch kein verwegener Wunsch, dass ConPresso das auch können müsste....? :lol:
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

Wenn sich etwas einstellen lässt, dann ja nicht deswegen, weil es nur eine sinnvolle Einstellung geben kann.

Für Geld kriegst Du übrigens alles, auch ein Conpresso mit UTF-8...
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7361
Registriert: 01.01.1970 01:00
Hat sich bedankt: 110 Mal
Danksagung erhalten: 933 Mal
Kontaktdaten:

Beitrag von MarkusR »

Nur zur Info:

Das Dumme ist ja, dass UTF-8 zwar als Default eingestellt wird, aber die meisten Funktionen gar nicht Multibyte-fähig sind.

Also müssen folgende Funktionen
&#8203;check_&#8203;encoding, &#8203;convert_&#8203;case, &#8203;convert_&#8203;encoding, &#8203;convert_&#8203;kana, &#8203;convert_&#8203;variables, &#8203;decode_&#8203;mimeheader, &#8203;decode_&#8203;numericentity, &#8203;detect_&#8203;encoding, &#8203;detect_&#8203;order, &#8203;encode_&#8203;mimeheader, &#8203;encode_&#8203;numericentity, &#8203;encoding_&#8203;aliases, &#8203;ereg_&#8203;match, &#8203;ereg_&#8203;replace_&#8203;callback, &#8203;ereg_&#8203;replace, &#8203;ereg_&#8203;search_&#8203;getpos, &#8203;ereg_&#8203;search_&#8203;getregs, &#8203;ereg_&#8203;search_&#8203;init, &#8203;ereg_&#8203;search_&#8203;pos, &#8203;ereg_&#8203;search_&#8203;regs, &#8203;ereg_&#8203;search_&#8203;setpos, &#8203;ereg_&#8203;search, &#8203;ereg, &#8203;eregi_&#8203;replace, &#8203;eregi, &#8203;get_&#8203;info, &#8203;http_&#8203;input, &#8203;http_&#8203;output, &#8203;internal_&#8203;encoding, &#8203;language, &#8203;list_&#8203;encodings, &#8203;output_&#8203;handler, &#8203;parse_&#8203;str, &#8203;preferred_&#8203;mime_&#8203;name, &#8203;regex_&#8203;encoding, &#8203;regex_&#8203;set_&#8203;options, &#8203;send_&#8203;mail, &#8203;split, &#8203;strcut, &#8203;strimwidth, &#8203;stripos, &#8203;stristr, &#8203;strlen, &#8203;strpos, &#8203;strrchr, &#8203;strrichr, &#8203;strripos, &#8203;strrpos, &#8203;strstr, &#8203;strtolower, &#8203;strtoupper, &#8203;strwidth, &#8203;substitute_&#8203;character, &#8203;substr_&#8203;count, &#8203;substr

ersetzt werden durch
mb_&#8203;check_&#8203;encoding, mb_&#8203;convert_&#8203;case, mb_&#8203;convert_&#8203;encoding, mb_&#8203;convert_&#8203;kana, mb_&#8203;convert_&#8203;variables, mb_&#8203;decode_&#8203;mimeheader, mb_&#8203;decode_&#8203;numericentity, mb_&#8203;detect_&#8203;encoding, mb_&#8203;detect_&#8203;order, mb_&#8203;encode_&#8203;mimeheader, mb_&#8203;encode_&#8203;numericentity, mb_&#8203;encoding_&#8203;aliases, mb_&#8203;ereg_&#8203;match, mb_&#8203;ereg_&#8203;replace_&#8203;callback, mb_&#8203;ereg_&#8203;replace, mb_&#8203;ereg_&#8203;search_&#8203;getpos, mb_&#8203;ereg_&#8203;search_&#8203;getregs, mb_&#8203;ereg_&#8203;search_&#8203;init, mb_&#8203;ereg_&#8203;search_&#8203;pos, mb_&#8203;ereg_&#8203;search_&#8203;regs, mb_&#8203;ereg_&#8203;search_&#8203;setpos, mb_&#8203;ereg_&#8203;search, mb_&#8203;ereg, mb_&#8203;eregi_&#8203;replace, mb_&#8203;eregi, mb_&#8203;get_&#8203;info, mb_&#8203;http_&#8203;input, mb_&#8203;http_&#8203;output, mb_&#8203;internal_&#8203;encoding, mb_&#8203;language, mb_&#8203;list_&#8203;encodings, mb_&#8203;output_&#8203;handler, mb_&#8203;parse_&#8203;str, mb_&#8203;preferred_&#8203;mime_&#8203;name, mb_&#8203;regex_&#8203;encoding, mb_&#8203;regex_&#8203;set_&#8203;options, mb_&#8203;send_&#8203;mail, mb_&#8203;split, mb_&#8203;strcut, mb_&#8203;strimwidth, mb_&#8203;stripos, mb_&#8203;stristr, mb_&#8203;strlen, mb_&#8203;strpos, mb_&#8203;strrchr, mb_&#8203;strrichr, mb_&#8203;strripos, mb_&#8203;strrpos, mb_&#8203;strstr, mb_&#8203;strtolower, mb_&#8203;strtoupper, mb_&#8203;strwidth, mb_&#8203;substitute_&#8203;character, mb_&#8203;substr_&#8203;count, mb_&#8203;substr

oder man muss die php.ini bearbeiten können, um diese überschreiben zu lassen.

Hier gibt es auch eine Anleitung für die Do-It-Yourself Anwendung :wink:
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
dutch
ConPresso-Experte
Beiträge: 547
Registriert: 04.07.2007 17:12
Hat sich bedankt: 27 Mal
Danksagung erhalten: 7 Mal

Beitrag von dutch »

Was ich trotzdem bei all dem nicht verstehe ist, warum (bisher) nur die Zeichen ‘ ’ nicht korrekt angezeigt werden, ein ä, ö oder ü aber schon...

Und ‘ ’ sind ja eigentlich keine sooo ungewöhnlichen Zeichen. Die wurden über eine normale Tastatur in ein Webformular eingegeben, und von jemandem, bei dem ich mir ziemlich sicher bin, dass er wirklich nur seine Standard-Tasten verwendet und keine exotischen Zeichen über alt+Kombinatioen oder was auch immer eingibt.

Gibt es dafür eine logische Erklärung??

Gruß,
dutch
Antworten