SimplePie_Decode_HTML_Entities

Decode HTML Entities.

Defined (1)

The class is defined in the following location(s).

/wp-includes/SimplePie/Decode/HTML/Entities.php  
  1. class SimplePie_Decode_HTML_Entities 
  2. /** 
  3. * Data to be parsed 
  4. * @access private 
  5. * @var string 
  6. */ 
  7. var $data = ''; 
  8.  
  9. /** 
  10. * Currently consumed bytes 
  11. * @access private 
  12. * @var string 
  13. */ 
  14. var $consumed = ''; 
  15.  
  16. /** 
  17. * Position of the current byte being parsed 
  18. * @access private 
  19. * @var int 
  20. */ 
  21. var $position = 0; 
  22.  
  23. /** 
  24. * Create an instance of the class with the input data 
  25. * @access public 
  26. * @param string $data Input data 
  27. */ 
  28. public function __construct($data) 
  29. $this->data = $data; 
  30.  
  31. /** 
  32. * Parse the input data 
  33. * @access public 
  34. * @return string Output data 
  35. */ 
  36. public function parse() 
  37. while (($this->position = strpos($this->data, '&', $this->position)) !== false) 
  38. $this->consume(); 
  39. $this->entity(); 
  40. $this->consumed = ''; 
  41. return $this->data; 
  42.  
  43. /** 
  44. * Consume the next byte 
  45. * @access private 
  46. * @return mixed The next byte, or false, if there is no more data 
  47. */ 
  48. public function consume() 
  49. if (isset($this->data[$this->position])) 
  50. $this->consumed .= $this->data[$this->position]; 
  51. return $this->data[$this->position++]; 
  52. else 
  53. return false; 
  54.  
  55. /** 
  56. * Consume a range of characters 
  57. * @access private 
  58. * @param string $chars Characters to consume 
  59. * @return mixed A series of characters that match the range, or false 
  60. */ 
  61. public function consume_range($chars) 
  62. if ($len = strspn($this->data, $chars, $this->position)) 
  63. $data = substr($this->data, $this->position, $len); 
  64. $this->consumed .= $data; 
  65. $this->position += $len; 
  66. return $data; 
  67. else 
  68. return false; 
  69.  
  70. /** 
  71. * Unconsume one byte 
  72. * @access private 
  73. */ 
  74. public function unconsume() 
  75. $this->consumed = substr($this->consumed, 0, -1); 
  76. $this->position--; 
  77.  
  78. /** 
  79. * Decode an entity 
  80. * @access private 
  81. */ 
  82. public function entity() 
  83. switch ($this->consume()) 
  84. case "\x09": 
  85. case "\x0A": 
  86. case "\x0B": 
  87. case "\x0B": 
  88. case "\x0C": 
  89. case "\x20": 
  90. case "\x3C": 
  91. case "\x26": 
  92. case false: 
  93. break; 
  94.  
  95. case "\x23": 
  96. switch ($this->consume()) 
  97. case "\x78": 
  98. case "\x58": 
  99. $range = '0123456789ABCDEFabcdef'; 
  100. $hex = true; 
  101. break; 
  102.  
  103. default: 
  104. $range = '0123456789'; 
  105. $hex = false; 
  106. $this->unconsume(); 
  107. break; 
  108.  
  109. if ($codepoint = $this->consume_range($range)) 
  110. static $windows_1252_specials = array(0x0D => "\x0A", 0x80 => "\xE2\x82\xAC", 0x81 => "\xEF\xBF\xBD", 0x82 => "\xE2\x80\x9A", 0x83 => "\xC6\x92", 0x84 => "\xE2\x80\x9E", 0x85 => "\xE2\x80\xA6", 0x86 => "\xE2\x80\xA0", 0x87 => "\xE2\x80\xA1", 0x88 => "\xCB\x86", 0x89 => "\xE2\x80\xB0", 0x8A => "\xC5\xA0", 0x8B => "\xE2\x80\xB9", 0x8C => "\xC5\x92", 0x8D => "\xEF\xBF\xBD", 0x8E => "\xC5\xBD", 0x8F => "\xEF\xBF\xBD", 0x90 => "\xEF\xBF\xBD", 0x91 => "\xE2\x80\x98", 0x92 => "\xE2\x80\x99", 0x93 => "\xE2\x80\x9C", 0x94 => "\xE2\x80\x9D", 0x95 => "\xE2\x80\xA2", 0x96 => "\xE2\x80\x93", 0x97 => "\xE2\x80\x94", 0x98 => "\xCB\x9C", 0x99 => "\xE2\x84\xA2", 0x9A => "\xC5\xA1", 0x9B => "\xE2\x80\xBA", 0x9C => "\xC5\x93", 0x9D => "\xEF\xBF\xBD", 0x9E => "\xC5\xBE", 0x9F => "\xC5\xB8"); 
  111.  
  112. if ($hex) 
  113. $codepoint = hexdec($codepoint); 
  114. else 
  115. $codepoint = intval($codepoint); 
  116.  
  117. if (isset($windows_1252_specials[$codepoint])) 
  118. $replacement = $windows_1252_specials[$codepoint]; 
  119. else 
  120. $replacement = SimplePie_Misc::codepoint_to_utf8($codepoint); 
  121.  
  122. if (!in_array($this->consume(), array(';', false), true)) 
  123. $this->unconsume(); 
  124.  
  125. $consumed_length = strlen($this->consumed); 
  126. $this->data = substr_replace($this->data, $replacement, $this->position - $consumed_length, $consumed_length); 
  127. $this->position += strlen($replacement) - $consumed_length; 
  128. break; 
  129.  
  130. default: 
  131. static $entities = array( 
  132. 'Aacute' => "\xC3\x81",  
  133. 'aacute' => "\xC3\xA1",  
  134. 'Aacute;' => "\xC3\x81",  
  135. 'aacute;' => "\xC3\xA1",  
  136. 'Acirc' => "\xC3\x82",  
  137. 'acirc' => "\xC3\xA2",  
  138. 'Acirc;' => "\xC3\x82",  
  139. 'acirc;' => "\xC3\xA2",  
  140. 'acute' => "\xC2\xB4",  
  141. 'acute;' => "\xC2\xB4",  
  142. 'AElig' => "\xC3\x86",  
  143. 'aelig' => "\xC3\xA6",  
  144. 'AElig;' => "\xC3\x86",  
  145. 'aelig;' => "\xC3\xA6",  
  146. 'Agrave' => "\xC3\x80",  
  147. 'agrave' => "\xC3\xA0",  
  148. 'Agrave;' => "\xC3\x80",  
  149. 'agrave;' => "\xC3\xA0",  
  150. 'alefsym;' => "\xE2\x84\xB5",  
  151. 'Alpha;' => "\xCE\x91",  
  152. 'alpha;' => "\xCE\xB1",  
  153. 'AMP' => "\x26",  
  154. 'amp' => "\x26",  
  155. 'AMP;' => "\x26",  
  156. 'amp;' => "\x26",  
  157. 'and;' => "\xE2\x88\xA7",  
  158. 'ang;' => "\xE2\x88\xA0",  
  159. 'apos;' => "\x27",  
  160. 'Aring' => "\xC3\x85",  
  161. 'aring' => "\xC3\xA5",  
  162. 'Aring;' => "\xC3\x85",  
  163. 'aring;' => "\xC3\xA5",  
  164. 'asymp;' => "\xE2\x89\x88",  
  165. 'Atilde' => "\xC3\x83",  
  166. 'atilde' => "\xC3\xA3",  
  167. 'Atilde;' => "\xC3\x83",  
  168. 'atilde;' => "\xC3\xA3",  
  169. 'Auml' => "\xC3\x84",  
  170. 'auml' => "\xC3\xA4",  
  171. 'Auml;' => "\xC3\x84",  
  172. 'auml;' => "\xC3\xA4",  
  173. 'bdquo;' => "\xE2\x80\x9E",  
  174. 'Beta;' => "\xCE\x92",  
  175. 'beta;' => "\xCE\xB2",  
  176. 'brvbar' => "\xC2\xA6",  
  177. 'brvbar;' => "\xC2\xA6",  
  178. 'bull;' => "\xE2\x80\xA2",  
  179. 'cap;' => "\xE2\x88\xA9",  
  180. 'Ccedil' => "\xC3\x87",  
  181. 'ccedil' => "\xC3\xA7",  
  182. 'Ccedil;' => "\xC3\x87",  
  183. 'ccedil;' => "\xC3\xA7",  
  184. 'cedil' => "\xC2\xB8",  
  185. 'cedil;' => "\xC2\xB8",  
  186. 'cent' => "\xC2\xA2",  
  187. 'cent;' => "\xC2\xA2",  
  188. 'Chi;' => "\xCE\xA7",  
  189. 'chi;' => "\xCF\x87",  
  190. 'circ;' => "\xCB\x86",  
  191. 'clubs;' => "\xE2\x99\xA3",  
  192. 'cong;' => "\xE2\x89\x85",  
  193. 'COPY' => "\xC2\xA9",  
  194. 'copy' => "\xC2\xA9",  
  195. 'COPY;' => "\xC2\xA9",  
  196. 'copy;' => "\xC2\xA9",  
  197. 'crarr;' => "\xE2\x86\xB5",  
  198. 'cup;' => "\xE2\x88\xAA",  
  199. 'curren' => "\xC2\xA4",  
  200. 'curren;' => "\xC2\xA4",  
  201. 'Dagger;' => "\xE2\x80\xA1",  
  202. 'dagger;' => "\xE2\x80\xA0",  
  203. 'dArr;' => "\xE2\x87\x93",  
  204. 'darr;' => "\xE2\x86\x93",  
  205. 'deg' => "\xC2\xB0",  
  206. 'deg;' => "\xC2\xB0",  
  207. 'Delta;' => "\xCE\x94",  
  208. 'delta;' => "\xCE\xB4",  
  209. 'diams;' => "\xE2\x99\xA6",  
  210. 'divide' => "\xC3\xB7",  
  211. 'divide;' => "\xC3\xB7",  
  212. 'Eacute' => "\xC3\x89",  
  213. 'eacute' => "\xC3\xA9",  
  214. 'Eacute;' => "\xC3\x89",  
  215. 'eacute;' => "\xC3\xA9",  
  216. 'Ecirc' => "\xC3\x8A",  
  217. 'ecirc' => "\xC3\xAA",  
  218. 'Ecirc;' => "\xC3\x8A",  
  219. 'ecirc;' => "\xC3\xAA",  
  220. 'Egrave' => "\xC3\x88",  
  221. 'egrave' => "\xC3\xA8",  
  222. 'Egrave;' => "\xC3\x88",  
  223. 'egrave;' => "\xC3\xA8",  
  224. 'empty;' => "\xE2\x88\x85",  
  225. 'emsp;' => "\xE2\x80\x83",  
  226. 'ensp;' => "\xE2\x80\x82",  
  227. 'Epsilon;' => "\xCE\x95",  
  228. 'epsilon;' => "\xCE\xB5",  
  229. 'equiv;' => "\xE2\x89\xA1",  
  230. 'Eta;' => "\xCE\x97",  
  231. 'eta;' => "\xCE\xB7",  
  232. 'ETH' => "\xC3\x90",  
  233. 'eth' => "\xC3\xB0",  
  234. 'ETH;' => "\xC3\x90",  
  235. 'eth;' => "\xC3\xB0",  
  236. 'Euml' => "\xC3\x8B",  
  237. 'euml' => "\xC3\xAB",  
  238. 'Euml;' => "\xC3\x8B",  
  239. 'euml;' => "\xC3\xAB",  
  240. 'euro;' => "\xE2\x82\xAC",  
  241. 'exist;' => "\xE2\x88\x83",  
  242. 'fnof;' => "\xC6\x92",  
  243. 'forall;' => "\xE2\x88\x80",  
  244. 'frac12' => "\xC2\xBD",  
  245. 'frac12;' => "\xC2\xBD",  
  246. 'frac14' => "\xC2\xBC",  
  247. 'frac14;' => "\xC2\xBC",  
  248. 'frac34' => "\xC2\xBE",  
  249. 'frac34;' => "\xC2\xBE",  
  250. 'frasl;' => "\xE2\x81\x84",  
  251. 'Gamma;' => "\xCE\x93",  
  252. 'gamma;' => "\xCE\xB3",  
  253. 'ge;' => "\xE2\x89\xA5",  
  254. 'GT' => "\x3E",  
  255. 'gt' => "\x3E",  
  256. 'GT;' => "\x3E",  
  257. 'gt;' => "\x3E",  
  258. 'hArr;' => "\xE2\x87\x94",  
  259. 'harr;' => "\xE2\x86\x94",  
  260. 'hearts;' => "\xE2\x99\xA5",  
  261. 'hellip;' => "\xE2\x80\xA6",  
  262. 'Iacute' => "\xC3\x8D",  
  263. 'iacute' => "\xC3\xAD",  
  264. 'Iacute;' => "\xC3\x8D",  
  265. 'iacute;' => "\xC3\xAD",  
  266. 'Icirc' => "\xC3\x8E",  
  267. 'icirc' => "\xC3\xAE",  
  268. 'Icirc;' => "\xC3\x8E",  
  269. 'icirc;' => "\xC3\xAE",  
  270. 'iexcl' => "\xC2\xA1",  
  271. 'iexcl;' => "\xC2\xA1",  
  272. 'Igrave' => "\xC3\x8C",  
  273. 'igrave' => "\xC3\xAC",  
  274. 'Igrave;' => "\xC3\x8C",  
  275. 'igrave;' => "\xC3\xAC",  
  276. 'image;' => "\xE2\x84\x91",  
  277. 'infin;' => "\xE2\x88\x9E",  
  278. 'int;' => "\xE2\x88\xAB",  
  279. 'Iota;' => "\xCE\x99",  
  280. 'iota;' => "\xCE\xB9",  
  281. 'iquest' => "\xC2\xBF",  
  282. 'iquest;' => "\xC2\xBF",  
  283. 'isin;' => "\xE2\x88\x88",  
  284. 'Iuml' => "\xC3\x8F",  
  285. 'iuml' => "\xC3\xAF",  
  286. 'Iuml;' => "\xC3\x8F",  
  287. 'iuml;' => "\xC3\xAF",  
  288. 'Kappa;' => "\xCE\x9A",  
  289. 'kappa;' => "\xCE\xBA",  
  290. 'Lambda;' => "\xCE\x9B",  
  291. 'lambda;' => "\xCE\xBB",  
  292. 'lang;' => "\xE3\x80\x88",  
  293. 'laquo' => "\xC2\xAB",  
  294. 'laquo;' => "\xC2\xAB",  
  295. 'lArr;' => "\xE2\x87\x90",  
  296. 'larr;' => "\xE2\x86\x90",  
  297. 'lceil;' => "\xE2\x8C\x88",  
  298. 'ldquo;' => "\xE2\x80\x9C",  
  299. 'le;' => "\xE2\x89\xA4",  
  300. 'lfloor;' => "\xE2\x8C\x8A",  
  301. 'lowast;' => "\xE2\x88\x97",  
  302. 'loz;' => "\xE2\x97\x8A",  
  303. 'lrm;' => "\xE2\x80\x8E",  
  304. 'lsaquo;' => "\xE2\x80\xB9",  
  305. 'lsquo;' => "\xE2\x80\x98",  
  306. 'LT' => "\x3C",  
  307. 'lt' => "\x3C",  
  308. 'LT;' => "\x3C",  
  309. 'lt;' => "\x3C",  
  310. 'macr' => "\xC2\xAF",  
  311. 'macr;' => "\xC2\xAF",  
  312. 'mdash;' => "\xE2\x80\x94",  
  313. 'micro' => "\xC2\xB5",  
  314. 'micro;' => "\xC2\xB5",  
  315. 'middot' => "\xC2\xB7",  
  316. 'middot;' => "\xC2\xB7",  
  317. 'minus;' => "\xE2\x88\x92",  
  318. 'Mu;' => "\xCE\x9C",  
  319. 'mu;' => "\xCE\xBC",  
  320. 'nabla;' => "\xE2\x88\x87",  
  321. 'nbsp' => "\xC2\xA0",  
  322. 'nbsp;' => "\xC2\xA0",  
  323. 'ndash;' => "\xE2\x80\x93",  
  324. 'ne;' => "\xE2\x89\xA0",  
  325. 'ni;' => "\xE2\x88\x8B",  
  326. 'not' => "\xC2\xAC",  
  327. 'not;' => "\xC2\xAC",  
  328. 'notin;' => "\xE2\x88\x89",  
  329. 'nsub;' => "\xE2\x8A\x84",  
  330. 'Ntilde' => "\xC3\x91",  
  331. 'ntilde' => "\xC3\xB1",  
  332. 'Ntilde;' => "\xC3\x91",  
  333. 'ntilde;' => "\xC3\xB1",  
  334. 'Nu;' => "\xCE\x9D",  
  335. 'nu;' => "\xCE\xBD",  
  336. 'Oacute' => "\xC3\x93",  
  337. 'oacute' => "\xC3\xB3",  
  338. 'Oacute;' => "\xC3\x93",  
  339. 'oacute;' => "\xC3\xB3",  
  340. 'Ocirc' => "\xC3\x94",  
  341. 'ocirc' => "\xC3\xB4",  
  342. 'Ocirc;' => "\xC3\x94",  
  343. 'ocirc;' => "\xC3\xB4",  
  344. 'OElig;' => "\xC5\x92",  
  345. 'oelig;' => "\xC5\x93",  
  346. 'Ograve' => "\xC3\x92",  
  347. 'ograve' => "\xC3\xB2",  
  348. 'Ograve;' => "\xC3\x92",  
  349. 'ograve;' => "\xC3\xB2",  
  350. 'oline;' => "\xE2\x80\xBE",  
  351. 'Omega;' => "\xCE\xA9",  
  352. 'omega;' => "\xCF\x89",  
  353. 'Omicron;' => "\xCE\x9F",  
  354. 'omicron;' => "\xCE\xBF",  
  355. 'oplus;' => "\xE2\x8A\x95",  
  356. 'or;' => "\xE2\x88\xA8",  
  357. 'ordf' => "\xC2\xAA",  
  358. 'ordf;' => "\xC2\xAA",  
  359. 'ordm' => "\xC2\xBA",  
  360. 'ordm;' => "\xC2\xBA",  
  361. 'Oslash' => "\xC3\x98",  
  362. 'oslash' => "\xC3\xB8",  
  363. 'Oslash;' => "\xC3\x98",  
  364. 'oslash;' => "\xC3\xB8",  
  365. 'Otilde' => "\xC3\x95",  
  366. 'otilde' => "\xC3\xB5",  
  367. 'Otilde;' => "\xC3\x95",  
  368. 'otilde;' => "\xC3\xB5",  
  369. 'otimes;' => "\xE2\x8A\x97",  
  370. 'Ouml' => "\xC3\x96",  
  371. 'ouml' => "\xC3\xB6",  
  372. 'Ouml;' => "\xC3\x96",  
  373. 'ouml;' => "\xC3\xB6",  
  374. 'para' => "\xC2\xB6",  
  375. 'para;' => "\xC2\xB6",  
  376. 'part;' => "\xE2\x88\x82",  
  377. 'permil;' => "\xE2\x80\xB0",  
  378. 'perp;' => "\xE2\x8A\xA5",  
  379. 'Phi;' => "\xCE\xA6",  
  380. 'phi;' => "\xCF\x86",  
  381. 'Pi;' => "\xCE\xA0",  
  382. 'pi;' => "\xCF\x80",  
  383. 'piv;' => "\xCF\x96",  
  384. 'plusmn' => "\xC2\xB1",  
  385. 'plusmn;' => "\xC2\xB1",  
  386. 'pound' => "\xC2\xA3",  
  387. 'pound;' => "\xC2\xA3",  
  388. 'Prime;' => "\xE2\x80\xB3",  
  389. 'prime;' => "\xE2\x80\xB2",  
  390. 'prod;' => "\xE2\x88\x8F",  
  391. 'prop;' => "\xE2\x88\x9D",  
  392. 'Psi;' => "\xCE\xA8",  
  393. 'psi;' => "\xCF\x88",  
  394. 'QUOT' => "\x22",  
  395. 'quot' => "\x22",  
  396. 'QUOT;' => "\x22",  
  397. 'quot;' => "\x22",  
  398. 'radic;' => "\xE2\x88\x9A",  
  399. 'rang;' => "\xE3\x80\x89",  
  400. 'raquo' => "\xC2\xBB",  
  401. 'raquo;' => "\xC2\xBB",  
  402. 'rArr;' => "\xE2\x87\x92",  
  403. 'rarr;' => "\xE2\x86\x92",  
  404. 'rceil;' => "\xE2\x8C\x89",  
  405. 'rdquo;' => "\xE2\x80\x9D",  
  406. 'real;' => "\xE2\x84\x9C",  
  407. 'REG' => "\xC2\xAE",  
  408. 'reg' => "\xC2\xAE",  
  409. 'REG;' => "\xC2\xAE",  
  410. 'reg;' => "\xC2\xAE",  
  411. 'rfloor;' => "\xE2\x8C\x8B",  
  412. 'Rho;' => "\xCE\xA1",  
  413. 'rho;' => "\xCF\x81",  
  414. 'rlm;' => "\xE2\x80\x8F",  
  415. 'rsaquo;' => "\xE2\x80\xBA",  
  416. 'rsquo;' => "\xE2\x80\x99",  
  417. 'sbquo;' => "\xE2\x80\x9A",  
  418. 'Scaron;' => "\xC5\xA0",  
  419. 'scaron;' => "\xC5\xA1",  
  420. 'sdot;' => "\xE2\x8B\x85",  
  421. 'sect' => "\xC2\xA7",  
  422. 'sect;' => "\xC2\xA7",  
  423. 'shy' => "\xC2\xAD",  
  424. 'shy;' => "\xC2\xAD",  
  425. 'Sigma;' => "\xCE\xA3",  
  426. 'sigma;' => "\xCF\x83",  
  427. 'sigmaf;' => "\xCF\x82",  
  428. 'sim;' => "\xE2\x88\xBC",  
  429. 'spades;' => "\xE2\x99\xA0",  
  430. 'sub;' => "\xE2\x8A\x82",  
  431. 'sube;' => "\xE2\x8A\x86",  
  432. 'sum;' => "\xE2\x88\x91",  
  433. 'sup;' => "\xE2\x8A\x83",  
  434. 'sup1' => "\xC2\xB9",  
  435. 'sup1;' => "\xC2\xB9",  
  436. 'sup2' => "\xC2\xB2",  
  437. 'sup2;' => "\xC2\xB2",  
  438. 'sup3' => "\xC2\xB3",  
  439. 'sup3;' => "\xC2\xB3",  
  440. 'supe;' => "\xE2\x8A\x87",  
  441. 'szlig' => "\xC3\x9F",  
  442. 'szlig;' => "\xC3\x9F",  
  443. 'Tau;' => "\xCE\xA4",  
  444. 'tau;' => "\xCF\x84",  
  445. 'there4;' => "\xE2\x88\xB4",  
  446. 'Theta;' => "\xCE\x98",  
  447. 'theta;' => "\xCE\xB8",  
  448. 'thetasym;' => "\xCF\x91",  
  449. 'thinsp;' => "\xE2\x80\x89",  
  450. 'THORN' => "\xC3\x9E",  
  451. 'thorn' => "\xC3\xBE",  
  452. 'THORN;' => "\xC3\x9E",  
  453. 'thorn;' => "\xC3\xBE",  
  454. 'tilde;' => "\xCB\x9C",  
  455. 'times' => "\xC3\x97",  
  456. 'times;' => "\xC3\x97",  
  457. 'TRADE;' => "\xE2\x84\xA2",  
  458. 'trade;' => "\xE2\x84\xA2",  
  459. 'Uacute' => "\xC3\x9A",  
  460. 'uacute' => "\xC3\xBA",  
  461. 'Uacute;' => "\xC3\x9A",  
  462. 'uacute;' => "\xC3\xBA",  
  463. 'uArr;' => "\xE2\x87\x91",  
  464. 'uarr;' => "\xE2\x86\x91",  
  465. 'Ucirc' => "\xC3\x9B",  
  466. 'ucirc' => "\xC3\xBB",  
  467. 'Ucirc;' => "\xC3\x9B",  
  468. 'ucirc;' => "\xC3\xBB",  
  469. 'Ugrave' => "\xC3\x99",  
  470. 'ugrave' => "\xC3\xB9",  
  471. 'Ugrave;' => "\xC3\x99",  
  472. 'ugrave;' => "\xC3\xB9",  
  473. 'uml' => "\xC2\xA8",  
  474. 'uml;' => "\xC2\xA8",  
  475. 'upsih;' => "\xCF\x92",  
  476. 'Upsilon;' => "\xCE\xA5",  
  477. 'upsilon;' => "\xCF\x85",  
  478. 'Uuml' => "\xC3\x9C",  
  479. 'uuml' => "\xC3\xBC",  
  480. 'Uuml;' => "\xC3\x9C",  
  481. 'uuml;' => "\xC3\xBC",  
  482. 'weierp;' => "\xE2\x84\x98",  
  483. 'Xi;' => "\xCE\x9E",  
  484. 'xi;' => "\xCE\xBE",  
  485. 'Yacute' => "\xC3\x9D",  
  486. 'yacute' => "\xC3\xBD",  
  487. 'Yacute;' => "\xC3\x9D",  
  488. 'yacute;' => "\xC3\xBD",  
  489. 'yen' => "\xC2\xA5",  
  490. 'yen;' => "\xC2\xA5",  
  491. 'yuml' => "\xC3\xBF",  
  492. 'Yuml;' => "\xC5\xB8",  
  493. 'yuml;' => "\xC3\xBF",  
  494. 'Zeta;' => "\xCE\x96",  
  495. 'zeta;' => "\xCE\xB6",  
  496. 'zwj;' => "\xE2\x80\x8D",  
  497. 'zwnj;' => "\xE2\x80\x8C" 
  498. ); 
  499.  
  500. for ($i = 0, $match = null; $i < 9 && $this->consume() !== false; $i++) 
  501. $consumed = substr($this->consumed, 1); 
  502. if (isset($entities[$consumed])) 
  503. $match = $consumed; 
  504.  
  505. if ($match !== null) 
  506. $this->data = substr_replace($this->data, $entities[$match], $this->position - strlen($consumed) - 1, strlen($match) + 1); 
  507. $this->position += strlen($entities[$match]) - strlen($consumed) - 1; 
  508. break;