Por ahora, /rel es el original y /dev tiene actualizaciones:
Esta es la versión de A2O Power Processor Core RTL y la implementación FPGA asociada (utilizando ADM-PCIE-9V3 FPGA).
Consulte la información del proyecto para obtener más detalles.
El núcleo A2O se creó para optimizar el rendimiento de un solo subproceso y se dirigió a más de 3 GHz en tecnología de 45 nm.
Es una implementación de 27 FO4, con una tubería fuera de servicio que admite 1 o 2 hilos. Admite completamente Power ISA 2.07 usando el Libro III-E. El núcleo también fue diseñado para admitir implementaciones conectables de macros MMU y AXU Logic. Esto incluye la eliminación de la MMU y el uso de modo ERAT-solo para traducción/protección.
El diseño de A2O fue un seguimiento para A2I, escrito en Verilog, y admitió un recuento de subprocesos más bajo que A2I, pero un rendimiento más alto por hilo, utilizando la ejecución fuera de orden (renombra de registro, estaciones de reserva, búfer de finalización) y una cola de tiendas.
La interfaz externa A2L2 es en gran medida la misma para los dos núcleos.
Una comparación del diseño en tecnología original y escalada a 7 nm (SMT2, punto fijo, sin MMU):
| Frecuente | Pwr | Sort de libre | Sort de PWR | Área | VDD | |
|---|---|---|---|---|---|---|
| 45 nm | 2.30 GHz | 1.49 W | 4.90 mm 2 | 0.97 V | ||
| 7 nm | 3.90 GHz | 0.79 W | 4.17 GHz | 0.85 W | 0.31 mm 2 | 1.1 V |
| 7 nm | 3.75 GHz | 0.63 W | 4.03 GHz | 0.67 W | 0.31 mm 2 | 1.0 V |
| 7 nm | 3.55 GHz | 0.49 W | 3.87 GHz | 0.52 W | 0.31 mm 2 | 0.9 V |
| 7 nm | 3.07 GHz | 0.32 W | 3.60 GHz | 0.38 W | 0.31 mm 2 | 0.8 V |
| 7 nm | 2.40 GHz | 0.20 W | 3.00 GHz | 0.25 W | 0.31 mm 2 | 0.7 V |
Estas estimaciones se basan en un diseño semicustom en procesos de fundición representativos (IBM 45NM/Samsung 7nm).
El A2O Core cumple con Power ISA 2.07 y necesitará actualizaciones para cumplir con la versión 3.0c o 3.1. Power ISA 3.0c y 3.1 son las dos versiones de Power ISA que contribuyen a OpenPower Foundation por IBM. Los cambios incluirán:
A2O no fue lanzado como producto; La documentación se derivó de A2I pero es mucho menos completa que la versión A2I. La documentación ha sido editada y actualizada cuando sea posible, pero sin duda, quedan errores en frente al RTL (especialmente probablemente en SPRS específicos de implementación).
Utilice 'problemas' para informar errores.
Hay un problema que se está evitando al establecer LSUC0.DFWD = 1 y limitar el tamaño de la cola de la tienda (actualmente en 4). Si bien parece estar directamente relacionado con el reenvío (HIT de L1 DC devuelve 0 en lugar de datos), el tamaño de la cola de almacenamiento también tuvo que ser limitado.
No depurado en este momento; podría estar relacionado con: