@ agnasg

agnasg


No se puede analizar HTML con expresiones regulares

06-01-2013 9:00 AM

Stackoverflow no es mi sitio favorito para conseguir respuestas. Me parece muy opresivo. Con frecuencia consigues regaños “Esta pregunta ya se hizo anteriormente aqui y aqui”. Parecen nazis. Es increíble que esta respuesta a la pregunta cómo analizar algunos tags HTML haya llegado tan lejos, incluyendo una respuesta con 4432 puntos de un individuo que enloquece diciendo “No se puede analizar HTML con expresiones regulares”. Yo descubrí eso malamente, porque haciendo scrapping (extrayendo info de web sites) hay que analizar los tags de html. Y lo he hecho con expresiones regulares, pero solamente tags muy sencillos, no he necesitado analizar cualquier construcción HTML. Porque la verdad es que no se puede analizar HTML con expresiones regulares. En la mencionada discusión (ya bloqueada por cierto) esta pregunta es respondida una y otra vez y se indica todo lo que puede suceder si lo intentas, incluyendo la destrucción de tu mente, la liberación de almas perdidas del plano astral, la profanación de vírgenes por el niño obsceno, la mente del programador será transportada a un mundo de delirio, etc. “Tratar de analizar HTML con expresiones regurales es como decirle a Paris Hilton que escriba un sistema operativo”. “Sólo Chuck Norris puede analizar HTML con expresiones regulares”. La discusión continúa hasta el infinito en similares términos.