Cuándo conviene la conversión inversa
Lo más común es ir de Markdown a HTML, pero el camino opuesto también tiene casos legítimos. Cuando migrás un blog viejo en WordPress a un sitio estático moderno (Astro, Hugo, Eleventy), todo el contenido vive en HTML dentro de la base de datos. Convertirlo a Markdown te permite versionar el copy en git y editarlo con un editor de texto plano sin abrir el panel del CMS.
Casos de uso reales
- Migración de CMS. WordPress, Drupal, Ghost — todos exportan HTML. Markdown es el formato intermedio universal para llevar el contenido a otra plataforma.
- Archivado en Obsidian o Notion. Si querés guardar artículos de blogs externos, Markdown es el formato natural de estas herramientas.
- Versionado en git. Markdown produce diffs legibles; HTML, no. Un cambio mínimo de copy se ve clarito en git diff.
- Limpiar HTML pegado. Cuando copiás de Word o Google Docs y pegás en un editor, viene con docenas de etiquetas y estilos basura. Convertir a Markdown limpia todo de un saque.
Lo que se pierde en la conversión
Markdown es deliberadamente pobre en expresividad: solo soporta elementos básicos. En la conversión perdés estilos inline (color rojo, font-size 14px), clases CSS, atributos personalizados (data-*, aria-*), tags semánticos avanzados (article, section, aside) y todo lo que sea presentación pura. Eso es bueno: el contenido queda libre de basura visual y se puede re-renderizar con cualquier estilo después.
Lo que se preserva
- Jerarquía de títulos (h1-h6).
- Párrafos y saltos de línea significativos.
- Énfasis (strong, em, b, i).
- Listas (ul, ol) con anidamiento básico.
- Links y URLs.
- Imágenes con alt y src.
- Bloques de código y código inline.
- Citas (blockquote).
Tips para una conversión limpia
Antes de convertir, pasá el HTML por un sanitizador si viene de Word o Outlook: esos editores meten markup con <o:p>, <span style="..."> y otras delicias. También conviene quitar <style> y <script> antes de pasarlo: no aportan nada al Markdown final. Si tu HTML usa tablas y necesitás conservarlas, considerá un parser más completo: Markdown estándar no las representa bien.
Diff entre formatos
Un párrafo HTML típico ocupa 80 caracteres entre etiquetas: <p>Hola mundo</p>. El mismo en Markdown ocupa 11: Hola mundo. Multiplicado por miles de párrafos, la diferencia es brutal en bases de datos y repos. Un sitio que guarda contenido en Markdown y compila a HTML solo cuando hace falta es siempre más liviano.