Arquitectura de un Ordenador Actual
Documento resumen sobre cómo está compuesto realmente un ordenador hoy en día, con las tecnologías que se usan para interconectar la CPU, la RAM, la GPU y el resto de componentes. Incluye el funcionamiento interno de la CPU (registros, ciclo fetch-decode-execute, reloj…) y las diferencias en portátiles.
1. Visión general: cómo ha cambiado la arquitectura
Hace años, la placa base se organizaba en torno a dos chips externos a la CPU:
- Northbridge → comunicaba CPU ↔ RAM ↔ GPU (alta velocidad).
- Southbridge → manejaba los periféricos lentos (USB, SATA, audio, BIOS…).
Hoy esto ya no funciona así. Desde Intel Nehalem (2008) y AMD K10, el northbridge se ha integrado dentro de la propia CPU. Lo que antes hacía el northbridge ahora lo hace el procesador directamente, y lo que hacía el southbridge lo hace un único chip llamado:
- PCH (Platform Controller Hub) en Intel.
- FCH (Fusion Controller Hub) o simplemente chipset en AMD.
┌──────────────────────────────────────────────────┐
│ CPU │
│ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │
│ │Core 0│ │Core 1│ │Core 2│ │Core 3│ ... │
│ └──────┘ └──────┘ └──────┘ └──────┘ │
│ Ring Bus / Mesh (interconexión interna) │
│ ┌──────────────────────────────────────────┐ │
│ │ L3 Cache compartida │ │
│ └──────────────────────────────────────────┘ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────┐ │
│ │ IMC │ │ Controlador │ │ iGPU │ │
│ │ (RAM) │ │ PCIe │ │ (opc.) │ │
│ └──────┬──────┘ └──────┬──────┘ └─────────┘ │
│ │ │ │
└─────────┼────────────────┼───────────────────────┘
│ │
DDR5 RAM PCIe 5.0 → GPU, SSD NVMe
│
│ DMI 4.0 (Intel) / Infinity Fabric (AMD)
▼
┌──────────────────────┐
│ PCH / Chipset │
│ USB, SATA, audio, │
│ Ethernet, PCIe extra │
└──────────────────────┘
2. La CPU por dentro
2.1. Bloques funcionales clásicos
Toda CPU contiene básicamente:
- ALU (Arithmetic Logic Unit): hace operaciones aritméticas (suma, resta…) y lógicas (AND, OR, XOR…).
- FPU (Floating Point Unit): operaciones con números en coma flotante.
- CU (Control Unit / Unidad de Control): decodifica instrucciones y orquesta al resto de unidades.
- Registros: memoria ultrarrápida dentro de la CPU.
- Caché interna (L1, L2 y a veces L3 dentro del core).
2.2. Registros importantes
| Registro |
Nombre |
Función |
| PC |
Program Counter (en x86 se llama EIP/RIP, Instruction Pointer) |
Contiene la dirección de memoria de la siguiente instrucción a ejecutar. |
| IR |
Instruction Register |
Guarda la instrucción actual que se está ejecutando. |
| MAR |
Memory Address Register |
Dirección de memoria a la que se va a acceder. |
| MDR / MBR |
Memory Data / Buffer Register |
Dato leído/escrito en memoria. |
| SR / FLAGS |
Status Register |
Banderas de estado (cero, acarreo, signo, overflow…). |
| SP |
Stack Pointer |
Apunta a la cima de la pila. |
| BP |
Base Pointer |
Referencia para acceder a variables locales en la pila. |
| Registros de propósito general |
RAX, RBX, RCX, RDX… (en x86-64) |
Almacenan operandos y resultados. |
2.3. El reloj (clock)
- Es una señal cuadrada que marca el ritmo al que avanza la CPU.
- Se mide en GHz (3,5 GHz = 3.500 millones de ciclos por segundo).
- Cada instrucción tarda uno o varios ciclos en completarse según su complejidad.
- Los procesadores modernos usan frecuencias variables:
- Base clock: frecuencia garantizada.
- Turbo / Boost: subida automática cuando hay margen térmico (Intel Turbo Boost, AMD Precision Boost).
- P-States / C-States: ahorro de energía bajando frecuencia o apagando núcleos.
2.4. Ciclo Fetch-Decode-Execute
Es el ciclo fundamental que repite la CPU continuamente:
-
Fetch (Búsqueda)
- La CU lee la dirección que hay en el PC.
- Se va a la memoria (o caché) a buscar la instrucción.
- Se carga en el IR.
- Se incrementa el PC para apuntar a la siguiente instrucción.
-
Decode (Decodificación)
- La CU interpreta el opcode del IR.
- Identifica qué operación es y qué operandos necesita.
- En x86 esto incluye traducir la instrucción CISC a micro-ops (μops) internas tipo RISC.
-
Execute (Ejecución)
- Se ejecuta en la ALU/FPU o se hace el acceso a memoria que corresponda.
- El resultado se guarda en un registro o memoria.
-
(Write-back) algunos modelos añaden esta fase explícita: escribir el resultado donde toque.
2.5. Pipeline y ejecución fuera de orden
Las CPUs actuales no esperan a terminar una instrucción para empezar la siguiente:
- Pipeline: varias instrucciones en distintas fases a la vez (mientras una se ejecuta, otra se decodifica y otra se está buscando).
- Superescalar: varios pipelines en paralelo → varias instrucciones por ciclo (IPC).
- Out-of-Order Execution (OoO): reordena instrucciones para no esperar dependencias.
- Branch Prediction: predice qué rama tomará un
if para no romper el pipeline.
- Speculative Execution: ejecuta especulativamente antes de saber si hace falta (origen de vulnerabilidades como Spectre/Meltdown).
2.6. Cachés
Memoria SRAM muy rápida dentro o pegada al core. Jerarquía típica:
| Nivel |
Tamaño |
Velocidad |
Ubicación |
| L1 |
32–80 KB (datos + instrucciones separadas) |
~1 ns |
Por core |
| L2 |
256 KB – 2 MB |
~3 ns |
Por core |
| L3 |
8 – 128 MB |
~10 ns |
Compartida entre todos los cores |
AMD añade en algunos Ryzen el 3D V-Cache (L3 apilada verticalmente, hasta 96+ MB).
2.7. Cores, threads y SMT/Hyper-Threading
- Core físico: un procesador completo.
- SMT (Simultaneous Multi-Threading) o Hyper-Threading en Intel: cada core ejecuta 2 hilos lógicos simultáneamente aprovechando huecos del pipeline.
- En Intel desde la 12ª generación hay arquitectura híbrida:
- P-cores (Performance): potentes, con HT.
- E-cores (Efficient): pequeños, sin HT, para tareas en segundo plano.
- Intel Thread Director indica al SO en qué core poner cada hilo.
3. Interconexión interna de la CPU
Dentro de la CPU, los cores, la caché L3, el IMC y el controlador PCIe se comunican entre sí mediante:
- Intel:
- Ring Bus: anillo bidireccional (CPUs de consumo, hasta cierto número de cores).
- Mesh Interconnect: malla 2D en Xeon y CPUs grandes.
- AMD:
- Infinity Fabric (IF): bus coherente que conecta los CCX/CCD (chiplets) entre sí y con el IOD (Die de E/S). También se usa para conectar varias CPUs en servidores.
4. Memoria RAM
4.1. Controlador de memoria (IMC)
- Está integrado en la CPU (Integrated Memory Controller). Por eso ya no hay northbridge.
- Es el responsable de hablar directamente con los módulos de RAM.
4.2. Tecnologías actuales
- DDR4 (2014–): 2133–3200 MT/s nominal (overclock hasta 4000+).
- DDR5 (2021–): 4800–8000+ MT/s, PMIC integrado en el módulo, doble subcanal de 32 bits.
- Dual / Quad / Octa Channel: varios canales en paralelo multiplican el ancho de banda. En consumo lo normal es dual channel (2 módulos).
- ECC (Error-Correcting Code): corrige errores de bit, típico en servidores y workstations.
- DIMM: módulo largo (~133 mm), para sobremesa.
- SO-DIMM (Small Outline DIMM): la mitad de tamaño (~67 mm), para portátiles y mini-PCs.
- LPDDR (4X/5/5X): variante de bajo consumo, soldada directamente a la placa. Habitual en portátiles ultradelgados y MacBooks. No se puede ampliar.
- CAMM / CAMM2: nuevo estándar (2023+) para portátiles, más fino que SO-DIMM y reemplazable.
5. Conexión de la GPU y otros dispositivos rápidos: PCI Express
5.1. PCIe
- Bus serie punto a punto, por lanes (carriles). Cada lane = un par diferencial TX + RX.
- Los slots se nombran por número de lanes: x1, x4, x8, x16.
- La GPU dedicada usa típicamente un slot PCIe x16 conectado directamente a la CPU (no pasa por el chipset).
5.2. Versiones (ancho de banda por lane, unidireccional)
| Versión |
Por lane |
x16 total |
| PCIe 3.0 |
~1 GB/s |
~16 GB/s |
| PCIe 4.0 |
~2 GB/s |
~32 GB/s |
| PCIe 5.0 |
~4 GB/s |
~64 GB/s |
| PCIe 6.0 |
~8 GB/s |
~128 GB/s |
5.3. Resizable BAR / Smart Access Memory
Tecnología que permite a la CPU acceder a toda la VRAM de la GPU de golpe (antes solo veía ventanas de 256 MB). Mejora el rendimiento en juegos.
5.4. iGPU vs dGPU
- iGPU (integrada): dentro de la propia CPU, comparte la RAM del sistema (Intel UHD/Iris Xe, AMD Radeon Vega/RDNA en APUs).
- dGPU (dedicada): tarjeta aparte con su propia VRAM (GDDR6/GDDR6X/HBM), conectada por PCIe.
6. El enlace CPU ↔ Chipset
Como el chipset (PCH/FCH) ya no es el northbridge, su papel es expandir conectividad lenta y moderadamente rápida. Para hablar con la CPU se usa:
- Intel: DMI (Direct Media Interface)
- Actualmente DMI 4.0 x8 ≈ 16 GB/s (equivalente a PCIe 4.0 x8).
- Es por donde pasa todo lo que cuelga del PCH: USB, SATA, audio, Ethernet, y algunos PCIe extra.
- AMD: Infinity Fabric entre CPU y chipset (sobre enlace PCIe físico).
Esto significa que todos los dispositivos conectados al chipset comparten ese enlace con la CPU. Por eso una NVMe conectada al slot M.2 que cuelga del chipset puede ir un pelín peor que una conectada al M.2 que sale directo de la CPU.
7. DMA (Direct Memory Access)
7.1. Qué es
Mecanismo que permite a un dispositivo (disco, tarjeta de red, GPU…) leer/escribir directamente en la RAM sin tener que pasar por la CPU para cada byte. La CPU solo configura la transferencia; el resto lo hace el dispositivo.
7.2. Cómo es hoy en Intel
- Antiguamente había un chip DMA controller (Intel 8237) en el southbridge.
- Hoy, el DMA está distribuido:
- Cada dispositivo PCIe es bus master y hace sus propias transferencias DMA (es lo normal con NVMe, GPU, NICs…).
- El PCH integra controladores DMA para los buses lentos heredados (LPC, audio HDA, etc.).
- Intel incluye un motor DMA general llamado Intel I/OAT / CBDMA (Crystal Beach DMA) en plataformas server para copias memoria↔memoria.
- IOMMU: traducción y protección de direcciones de DMA. En Intel se llama VT-d, en AMD AMD-Vi. Es lo que permite que una VM tenga acceso seguro a un dispositivo físico (PCI passthrough), y evita que un dispositivo malicioso lea RAM arbitraria.
8. Almacenamiento
- SATA III: 6 Gb/s (~550 MB/s reales). Para SSDs y HDDs tradicionales. Cuelga del chipset.
- NVMe sobre PCIe (formato M.2 o U.2):
- PCIe 3.0 x4 → ~3,5 GB/s
- PCIe 4.0 x4 → ~7 GB/s
- PCIe 5.0 x4 → ~14 GB/s
- Algunos M.2 cuelgan directamente de la CPU, otros del chipset.
9. Buses serie de E/S externos
- USB: hoy USB 3.2 (hasta 20 Gb/s) y USB4 (hasta 40 Gb/s), gestionados por el PCH o controladores externos.
- Thunderbolt 3 / 4 / 5: combina PCIe + DisplayPort + USB sobre el mismo cable. TB4 = 40 Gb/s, TB5 = 80 Gb/s (120 Gb/s asimétrico).
- Ethernet: integrado en el PCH (PHY/MAC) o como tarjeta PCIe.
- Wi-Fi / Bluetooth: módulo CNVi (Intel) conectado al PCH, comparte radio integrada en el chipset.
10. Servidores y multi-socket
En workstations y servidores con varias CPUs, los procesadores se comunican entre sí:
- Intel: UPI (Ultra Path Interconnect) — sustituye al antiguo QPI.
- AMD: Infinity Fabric entre sockets.
Esto crea sistemas NUMA (Non-Uniform Memory Access): cada CPU tiene su RAM "cercana" y acceder a la RAM de la otra CPU es más lento.
11. Diferencias en portátiles
Los portátiles parten de la misma arquitectura, pero con adaptaciones:
11.1. CPU
- TDP mucho más bajo (15–45 W frente a 65–250 W en sobremesa).
- Series específicas: Intel U / P / H / HX, AMD Ryzen U / HS / HX.
- Frecuencias base más bajas, mucho más uso de turbo.
- iGPU casi siempre presente para ahorrar batería.
11.2. Memoria RAM
- SO-DIMM en portátiles "tradicionales" → ampliable.
- LPDDR4X / LPDDR5 / LPDDR5X soldada en ultrabooks, MacBooks, etc. → no se puede ampliar, pero consume mucho menos y va más rápido.
- Nuevo formato CAMM2 sustituyendo a SO-DIMM en algunos modelos: más fino y rápido, y reemplazable.
11.3. Almacenamiento
- Casi siempre M.2 NVMe (a veces soldado en ultrabooks).
- Rara vez SATA hoy en día.
11.4. GPU
- iGPU para uso normal + dGPU para juegos/IA (MUX switch u Optimus / SmartShift para conmutar y ahorrar batería).
- Las dGPU móviles tienen su propia VRAM (GDDR6) pero TDP recortado.
11.5. Refrigeración y energía
- Heatpipes + ventiladores compartidos CPU/GPU.
- Gestión agresiva de P-States/C-States y de la frecuencia.
- Controlador integrado (EC, Embedded Controller) gestiona teclado, batería, ventiladores, sensores…
11.6. Otros
- Pantalla conectada por eDP (Embedded DisplayPort) en lugar de HDMI/DP físico.
- Batería gestionada por PD (Power Delivery) sobre USB-C en muchos modelos.
- Wi-Fi y Bluetooth como módulo M.2 Key E o integrado en CNVi.
12. Resumen visual del flujo de datos
[RAM DDR5] ──── IMC ──┐
│
┌──────────▼──────────┐
│ CPU │
GPU ◄──────┤ Controlador PCIe 5.0│
NVMe ◄─────┤ │
│ Ring/Mesh + L3 │
│ Cores │
└──────────┬──────────┘
│ DMI 4.0
▼
┌─────────────────────┐
│ PCH │
│ USB, SATA, audio, │
│ Ethernet, PCIe x1… │
└─────────────────────┘
13. Glosario rápido
- ALU / FPU: unidades de cálculo.
- CU: unidad de control.
- PC / IP: registro con la dirección de la próxima instrucción.
- IR: registro con la instrucción actual.
- IMC: controlador de memoria integrado en CPU.
- PCH / FCH: chipset moderno (sustituye al southbridge).
- DMI: enlace CPU↔PCH en Intel.
- UPI / Infinity Fabric: interconexión entre sockets/chiplets.
- PCIe: bus principal para GPU, NVMe y tarjetas de expansión.
- DMA: acceso a RAM sin pasar por la CPU.
- IOMMU (VT-d / AMD-Vi): protege y traduce direcciones de DMA.
- SMT / Hyper-Threading: 2 hilos por core físico.
- P-core / E-core: cores de rendimiento y eficiencia (Intel híbrido).
- SO-DIMM / LPDDR / CAMM2: formatos de RAM en portátil.