The China Mail - Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

USD -
AED 3.6725
AFN 63.499066
ALL 81.115938
AMD 369.094488
ANG 1.789884
AOA 917.999902
ARS 1392.713504
AUD 1.380567
AWG 1.8
AZN 1.702577
BAM 1.65949
BBD 2.014662
BDT 122.963617
BGN 1.668102
BHD 0.378004
BIF 2979.907684
BMD 1
BND 1.266376
BOB 6.911825
BRL 4.908023
BSD 1.000288
BTN 94.642615
BWP 13.384978
BYN 2.824803
BYR 19600
BZD 2.011777
CAD 1.360345
CDF 2314.999756
CHF 0.77917
CLF 0.022876
CLP 900.230319
CNY 6.83035
CNH 6.81223
COP 3716.17
CRC 456.404426
CUC 1
CUP 26.5
CVE 93.559486
CZK 20.69095
DJF 178.124152
DKK 6.352983
DOP 59.588547
DZD 132.236548
EGP 52.611503
ERN 15
ETB 156.186957
EUR 0.85018
FJD 2.1835
FKP 0.736622
GBP 0.734295
GEL 2.689577
GGP 0.736622
GHS 11.253564
GIP 0.736622
GMD 73.000214
GNF 8779.35786
GTQ 7.635589
GYD 209.238393
HKD 7.835597
HNL 26.592734
HRK 6.402502
HTG 130.892895
HUF 305.347502
IDR 17332
ILS 2.905955
IMP 0.736622
INR 94.484298
IQD 1310.201485
IRR 1315999.999758
ISK 122.079883
JEP 0.736622
JMD 157.609595
JOD 0.708982
JPY 156.208501
KES 129.249915
KGS 87.420499
KHR 4009.129786
KMF 420.500226
KPW 900.003495
KRW 1447.820589
KWD 0.30794
KYD 0.83356
KZT 463.200855
LAK 21973.425197
LBP 89575.838311
LKR 320.221287
LRD 183.554507
LSL 16.305407
LTL 2.95274
LVL 0.60489
LYD 6.331536
MAD 9.184383
MDL 17.194712
MGA 4167.797991
MKD 52.29798
MMK 2099.549246
MNT 3579.649525
MOP 8.073157
MRU 39.923296
MUR 46.779638
MVR 15.455006
MWK 1734.489547
MXN 17.26055
MYR 3.925008
MZN 63.893159
NAD 16.305476
NGN 1361.139629
NIO 36.80763
NOK 9.265245
NPR 151.428014
NZD 1.67626
OMR 0.384478
PAB 1.000288
PEN 3.489513
PGK 4.349394
PHP 60.740503
PKR 278.705369
PLN 3.598665
PYG 6121.903517
QAR 3.646584
RON 4.471298
RSD 99.782804
RUB 74.849053
RWF 1462.717214
SAR 3.751823
SBD 8.032258
SCR 13.786507
SDG 600.499188
SEK 9.210465
SGD 1.268255
SHP 0.746601
SLE 24.624981
SLL 20969.496166
SOS 571.629786
SRD 37.476972
STD 20697.981008
STN 20.78808
SVC 8.752206
SYP 111.203697
SZL 16.3004
THB 32.200178
TJS 9.347679
TMT 3.505
TND 2.906356
TOP 2.40776
TRY 45.2247
TTD 6.778611
TWD 31.438007
TZS 2595.933022
UAH 43.857246
UGX 3761.369807
UYU 40.193288
UZS 12078.298941
VES 493.49396
VND 26325
VUV 118.250426
WST 2.722585
XAF 556.574973
XAG 0.01305
XAU 0.000214
XCD 2.70255
XCG 1.802793
XDR 0.696429
XOF 556.577334
XPF 101.191284
YER 238.605413
ZAR 16.406401
ZMK 9001.197853
ZMW 18.930729
ZWL 321.999592
  • Euro STOXX 50

    176.3000

    6045.93

    +2.92%

  • DAX

    644.9600

    25046.66

    +2.58%

  • TecDAX

    38.6900

    3843.64

    +1.01%

  • Goldpreis

    142.0000

    4710.5

    +3.01%

  • SDAX

    290.4500

    18473.33

    +1.57%

  • MDAX

    954.7100

    32087.43

    +2.98%

  • EUR/USD

    0.0076

    1.1773

    +0.65%

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen
Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Von Edge-Inferenz bis NVIDIA STX: speziell entwickelte KV-Cache-Infrastruktur für konsistente Leistung in großem Maßstab.

Textgröße:

SUNNYVALE, CA / ACCESS Newswire / 21. April 2026 / Graid Technology, der Pionier im Bereich GPU-beschleunigter NVMe-Speicher, hat heute sein Agentic AI Storage Portfolio vorgestellt: eine speziell entwickelte Familie von KV-Cache-Lösungen, die darauf ausgelegt ist, den Speicherengpass zu beseitigen, der „Always-on"-Produktions-KI ausbremst. Das Portfolio umfasst drei Bereitstellungsebenen: KV-Cache-Server, KV-Cache-Rack und KV-Cache-Plattform, die alle auf der SupremeRAID™-Technologie basieren. Die KV-Cache-Plattform, die höchste Stufe des Portfolios, ist auf die STX-Referenzarchitektur von NVIDIA abgestimmt, wobei die native BlueField-4-DPU-Ausführung für das zweite Halbjahr 2026 geplant ist.

Da agentische KI vom Experimentierstadium in die Produktion übergeht, haben sich die Infrastrukturannahmen, die der Single-Shot-Inferenz zugrunde lagen, als unhaltbar erwiesen. Modelle, die kontinuierliche mehrstufige Aufgaben ausführen und den Kontext über stundenlangen Betrieb hinweg aufrechterhalten, erzeugen KV-Cache-Anforderungen, die den GPU-HBM überlasten. Die Folge: Latenzspitzen von bis zu 18-fach, eine GPU-Auslastung von nur 50 % sowie Fehler auf Modellebene, darunter Halluzinationen und eine Verschlechterung der Schlussfolgerungsfähigkeit, die schwer zu erkennen und kostspielig zu beheben sind.

SupremeRAID™geht dieses Problem direkt an, indem es bis zu 32 NVMe-Laufwerke zu einem einzigen virtuellen Pool mit 280 GB/s bündelt, die CPU über GPU Direct Storage umgeht und KV-Cache-Lesevorgänge mit 1,3 ms liefert - 77-mal schneller als bei Standard-NVMe. Die drei Portfolio-Stufen machen diese Fähigkeit für jede Bereitstellungsgröße verfügbar:

KV-Cache-Server - NVMe-Beschleunigung auf Einzelknotenebene für einzelne Inferenzserver und Edge-AI-Bereitstellungen. Ab sofort verfügbar.

KV-Cache-Rack - Rack-Scale-Lösungen, die von Partnern validiert und gemeinsam mit führenden Server-OEM-Partnern für Multi-GPU-Cluster in Unternehmen entwickelt wurden. Jetzt verfügbar.

KV-Cache-Plattform - Speziell für die STX-Referenzarchitektur von NVIDIA entwickelt, mit nativer BlueField-4-DPU-Ausführung und einer auf Rack-Ebene skalierbaren Speichererweiterung in der Roadmap.

„Vor einem Jahr, auf der GTC 2025, prognostizierte Jensen Huang, dass Speicher erstmals GPU-beschleunigt werden würde. In diesem Jahr hat NVIDIA dieses Konzept mit STX und CMX in eine Architektur umgesetzt", sagte Leander Yu, CEO von Graid Technology. „Unser KV-Cache-Portfolio ist genau für diesen Moment konzipiert und liefert die Speicherleistung, die agentische KI erfordert, und das zu den Kosten einer Speicherebene."

Für Unternehmen und Infrastrukturteams, die den Einsatz von agentischer KI evaluieren, sind die vollständige Bereitstellungsarchitektur, technische Spezifikationen und Details zur NVIDIA STX-Kompatibilität im Solution Brief verfügbar: Graid Technology Agentic AI Storage Portfolio: Speziell entwickelte KV-Cache-Lösungen für Inferenz in großem Maßstab

Weitere Informationen zu den KI-Angeboten von Graid Technology finden Sie unter graidtech.com/ai

Medienanfragen:

Andrea Eaken, Sr. Direktor für Marketing, Americas & EMEA

[email protected]

____________________________________

Über Graid Technology

Graid Technology entwickelt die Speicherinfrastruktur für die Zukunft von KI, Unternehmen und Hochleistungsrechnen. Als Entwickler von SupremeRAID™, dem weltweit ersten und einzigen GPU-basierten RAID, und als globaler Verfechter von Intel® Virtual RAID on CPU (Intel® VROC) bietet Graid Technology flexible RAID-Lösungen, die die NVMe-Leistung maximieren und gleichzeitig einen ausfallsicheren, skalierbaren Datenschutz für moderne Dateninfrastrukturen gewährleisten. Graid Technology hat seinen Hauptsitz im Silicon Valley und verfügt über weltweite Niederlassungen sowie Forschungs- und Entwicklungszentren in Taiwan. Das Unternehmen treibt RAID-Innovationen für die nächste Generation datenintensiver Workloads voran. Weitere Informationen finden Sie unter graidtech.com.

QUELLE: Graid Technology Inc.

I.Taylor--ThChM--ThChM