Planificación
La fase de planificación de una web, como la de cualquier proyecto, puede llegar a ser un poco agobiante. El cliente y el webmaster suelen tener su propia opinión acerca de cómo debería ser la web, y a veces las dos opiniones entran en conflicto. El objetivo principal de un sitio web debería ser el de ser útil para los usuarios. En realidad, los que pueden decir los colaboradores, los grafistas o los programadores debería ser irrelevante para el webmaster, así como lo son sus gustos personales: si se hace una web para un target en concreto, sólo importará la opinión de la mayoría de ese target.
En las primeras fases del desarrollo de una web, la disciplina que debe tener el máximo protagonismo es la arquitectura de la información. Al principio, de lo que se trata es:
- pensar a quién va dirigida la web (el target)
- cuál es la información o los servicios que esperan encontrar
- cómo debería estar estructurada la web para que la navegabilidad (facilidad de moverse en la web) sea buena.
Para lograrlo, hay que subdividir la información en paquetes, o bultos, unir estos paquetes por afinidad y establecer la mejor forma de relacionar el uno con el otro.
Programación

Cuando los robots utilizados por los motores de búsqueda pueden entender la estructura general de una página web e identificar sus partes más importantes, será capaz de prestar una mayor atención a esa parte a la hora de indexar su contenido. Asignará a los links de la sección central una mayor relevancia que a los de otras secciones y daría mayor peso a la información contenida en esa sección para establecer el argumento principal de la web.
Hay que insistir acerca de la importancia de una codificación correcta, porque a menudo los errores de codificación acarrean consecuencias imprevisibles. Los errores más comunes.
Sistemas de extracción de la información y estructura de los datos
La forma en que se sirve la información de una web se suele clasificar como estructurada, semi estructurada o no estructurada.
- Estructurada quiere decir que las páginas se generan basándose en un único template o modelo, y contienen los mismos campos de información de una página a otra.
- Semi-estructurada cuando las páginas se basan en templates con una cierto número de variantes. Por ejemplo, una página puede contener campos de información que otras páginas no tienen, y otras podrían mostrar una gama más extensa de información.
- Una web no estructurada tiene un layout diferente prácticamente para cada página.
Los sistemas de extracción de información (IE Systems) se emplean para recoger y clasificar la información de webs semi-estructuradas y no estructuradas y alimentar bases de datos de los motores de búsqueda con información estructurada. Uno de los retos más relevantes de los Sistemas de extracción de información es precisamente el de extraer rápida y eficazmente la información contenida en una página HTML. La pregunta es : ¿cómo hace el Sistema de extracción de la información a encontrar el material válido en una página llena de código HTML, Java, etc., dejando de lado los contenidos irrelevantes?
Podría basarse en 'pistas' del lenguaje de programación como, por ejemplo:
- el estilo del contenido, como el color, el énfasis, el tamaño del texto, los encabezamientos, etc.
- la distribución geométrica de los elementos, como podría ser sunposicionamiento absoluto o relativo y
- una zona de las páginas que, por su posición, podría contener la información de mayor relevancia.
Averiguar, sin la ayuda de un navegador, las secciones importantes de una página es una tarea difícil, y es por ello que el lenguaje de programación de una web (que no se ve, a menos de mirar la fuente de la página) puede ser determinante a la hora de establecer un ranking para los robots, que no navegan de forma visual.
Optimización
Factores que influyen en el la visualización de una página web

Fuente: Skadberg, Y., and J. Kimmel. 2004. "Visitors' flow experience while browsing a Web site: its measurement, contributing factors and consequences."
La optimización de un website hace fluir su contenido y calibra el servidor para servir las páginas con una mayor rapidez. En los últimos 5 años (entre 2003 y 2008), el número de páginas en Internet se ha multiplicado por tres, y el número de 'objetos' (imágenes, vídeos, Scripts) en cada página se ha doblado, alcanzando una media de 50 objetos por página. Estos datos son suficientes para pensar que una cuestión esencial de un website es su velocidad de carga que, en muchos casos, es un instrumento fundamental para destacar de entre la competencia.
Evolución del tamaño de las páginas web

Fuente: Domenech, 2007 y Gómez, 2008