it-swarm-es.tech

¿Cómo lidiar con contenido duplicado / URL en Joomla?

Acabo de descubrir un importante problema de SEO y, aunque lo he resuelto por el momento; Estoy tratando de entender por qué puede haber ocurrido en primer lugar y si hubo un error o si tiene algo que ver con Joomla. Primero el problema:

Cuando rastreé un sitio con Moz, mostró cuatro contenidos duplicados para la página de inicio que era inesperado. Entonces, por ejemplo, para la página de inicio http://www.foo.com mostraba URL de contenido duplicado como la siguiente:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

Y todos estos enlaces simplemente estaban cargando el contenido de la página de inicio, pero los meta detalles eran del artículo. Obviamente, esto indica que Joomla estaba creando automáticamente los enlaces y encontré lo mismo para los 4 enlaces. El enlace en el artículo era así:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

Los Itemid = 1 corresponde al elemento del menú de la página de inicio que explica por qué se estaba cargando la página de inicio. Intenté recrear el problema pero no pude. Según las personas que agregaron el contenido, estos son los pasos que hicieron al crear esos artículos y enlaces dentro de él:

  1. Crear artículos
  2. Agregue un enlace a otros artículos usando la pestaña 'Artículo' en el editor de contenido.
  3. Crear elemento de menú para los artículos

Entonces me preguntaba si obviamente hay algo mal aquí. Estoy confundido porque hay más de 100 artículos, pero esto sucedió solo en unos 5 artículos. Gracias.

11
sifu

TOC de esta respuesta:

  1. Contenido bajo el mismo ID de artículo
  2. Cómo se crea contenido duplicado/Páginas dinámicas/URL
  3. Perspectiva SEO
  4. Manejo de contenido duplicado en Joomla
  5. Referencias y enlaces

1. ¿Por qué los artículos se muestran bajo el mismo itemid?

En primer lugar, este no es el problema por el que obtiene URL duplicadas. Los artículos están usando la identificación del artículo de la página de inicio, porque no hay otra identificación del artículo asignada para ellos.

Lea más sobre esto:

Y este también podría ser perspicaz:



2. Cómo se crea el "contenido duplicado"/Páginas dinámicas/URL

Este es en realidad un comportamiento estándar para sitios web dinámicos que generan sus páginas mediante el uso de parámetros de URL para construir Cadenas de consulta en forma de pares Campo-Valor . El servidor/aplicación recibirá la consulta, la procesará y devolverá el contenido asociativo al navegador.

Para comprender mejor esto, es posible que desee deshabilitar las URL de SEF en un sitio web de Joomla y estudiar un poco la URL no SEF de una página:

Ejemplo:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

Dividiendo la consulta anterior en pares de campos-valores, vemos:

  • opción = com_content
  • ver = artículo
  • id = 3
  • catido = 9
  • Itemid = 101

Estos son valores de campo que Joomla entiende e intentará devolver el siguiente contenido como:

Consultará en el componente com_content y usará una vista de artículo para mostrar el elemento de contenido (artículo) con id 3, de la categoría id 9, usando el elemento de menú con id 101.


Muchas variaciones de URL para 1 página

Sin embargo, el mismo artículo se puede mostrar con aún más combinación de campos y valores:

Algunas combinaciones posibles podrían ser:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = es
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = es

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = es & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = es & tmpl = component

Como puede ver, todo lo anterior solicita los mismos datos del sistema, que es el artículo con id = 3. Esto lleva al hecho de que se puede acceder al mismo contenido/página a través de varias URL diferentes y, en algunos casos, se puede se muestra en diferentes diseños.

* Con URL de SEF habilitadas en Joomla, lo anterior podría traducirse a más de 1 URL de SEF para el mismo artículo/contenido.



3. La perspectiva SEO

Los motores de búsqueda modernos y Google en particular, son conscientes de este comportamiento. Por lo general, harán todo lo posible para indexar y mantener en sus resultados de búsqueda la URL más adecuada para una página. Además, Google ha revelado que no hay una " penalización real " real por contenido duplicado debido a esto.

Sin embargo, el problema principal en el caso de que el mismo contenido/página se haya indexado más de una vez, es que posiblemente esté perdiendo ranking de página y el mejor posible Rendimiento SEO , porque el ranking de la página se dividirá en más de 1 página en lugar de 1.

Con esto en mente, es aconsejable lidiar con esto, en lugar de permitir que los motores de búsqueda indexen las URL al intentar adivinar si diferentes URL muestran el mismo contenido o contenido diferente.
Además, controlar sus URL y lo que SE debe indexar, puede ayudarlo a producir una mejor experiencia de usuario en su conjunto, ya que los usuarios del sitio encontrarán la misma página bajo 1 única URL estándar, y puede producir una estructura más sólida para un sitio web y su gestión.



4. Cómo lidiar con contenido duplicado

  • Uso de URL canónicas para sus páginas.
    Las URL canónicas le indicarán al motor de búsqueda cuál es la URL correcta de una página que deben rastrear y mantener en su índice.

  • Uso de metadatos INDEX/NOINDEX, FOLLOW/NOFOLLOW. El uso de dichos metadatos en sus páginas, indicará a los motores de búsqueda si desea que indexen o no el contenido de una página y seguir o no los enlaces que se encuentran en ella.

  • Uso de redireccionamientos 301/htaccess.
    Puede redirigir todas las demás URL a la que desea en la principal. Esto se puede lograr con Extensiones SEF o htaccess . Ambos proporcionan un gran poder, sin embargo, htaccess tiene una gran flexibilidad teniendo en cuenta la capacidad de usar expresiones regulares para todo tipo de redirecciones/reescrituras usando mod_rewrite. Con respecto a las extensiones J, cuando surge la necesidad, generalmente uso sh404SEF .

    Actualización: Como señaló @Neil Robertson en los comentarios: una redirección importante es desde la versión no www del sitio web a la versión www del sitio web o viceversa viceversa Agregue esto al archivo .htaccess para la redirección no www a www.

        ### Redirect non-www to www
        RewriteCond %{HTTP_Host} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_Host}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Uso de las herramientas de Google Webmasters
    Las Herramientas para webmasters de Google tienen opciones para ajustar el comportamiento del rastreador con su parámetros de URL .

  • Uso de sitemaps
    Envíe a los motores de búsqueda la estructura de URL de su sitio.

  • Usando el archivo Robots.txt
    Google y otros importantes SE están respetando su Robots.txt. Puede indicarles que no rastreen directorios/rutas de URL específicos.

Todas las opciones anteriores se pueden combinar para producir el resultado deseado.

* Como en todas partes, en Joomla, una buena planificación y organización del contenido siempre ayudan a alcanzar un mejor resultado. Especialmente con Joomla, esto también implica una categorización de contenido limpia y una estructura de elementos de menú.



5. Referencias y enlaces.

Extensiones SEO de Joomla

Por lo general, en Joomla, si desea lidiar con esto de manera eficiente, terminaría instalando una extensión SEO-SEF de terceros.



Más lectura:

15
FFrewin

Si tengo varios elementos de menú que van al mismo contenido, utilizo Enlaces del sistema/Alias ​​de elemento de menú ubicado en el Administrador de menús. Aquí hay un viejo artículo al respecto; pero el método todavía existe hoy: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias =

@Neil, estoy de acuerdo al 100% en que el contenido que no sea www vs www se lea como duplicado. Aquí está el código que obliga a www a no ser www. Colóquelo en su archivo htaccess. Además, también agrega el protocolo de seguridad https. Este código no es el único método, pero es lo que uso con éxito en muchos sitios.

RewriteCond %{HTTP_Host} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
0
yaya