@@ -214,8 +214,8 @@ void llama_kv_cache_unified::clear(bool data) {
214
214
}
215
215
216
216
bool llama_kv_cache_unified::seq_rm (llama_seq_id seq_id, llama_pos p0, llama_pos p1) {
217
- auto & cells = v_cells[seq_to_stream[ seq_id] ];
218
- auto & head = v_heads[seq_to_stream[ seq_id] ];
217
+ auto & cells = v_cells[seq_to_stream. at ( seq_id) ];
218
+ auto & head = v_heads[seq_to_stream. at ( seq_id) ];
219
219
220
220
uint32_t new_head = cells.size ();
221
221
@@ -263,8 +263,8 @@ bool llama_kv_cache_unified::seq_rm(llama_seq_id seq_id, llama_pos p0, llama_pos
263
263
}
264
264
265
265
void llama_kv_cache_unified::seq_cp (llama_seq_id seq_id_src, llama_seq_id seq_id_dst, llama_pos p0, llama_pos p1) {
266
- const auto s0 = seq_to_stream[ seq_id_src] ;
267
- const auto s1 = seq_to_stream[ seq_id_dst] ;
266
+ const auto s0 = seq_to_stream. at ( seq_id_src) ;
267
+ const auto s1 = seq_to_stream. at ( seq_id_dst) ;
268
268
269
269
if (s0 == s1) {
270
270
// since both sequences are in the same stream, no data copy is necessary
@@ -348,8 +348,8 @@ void llama_kv_cache_unified::seq_cp(llama_seq_id seq_id_src, llama_seq_id seq_id
348
348
}
349
349
350
350
void llama_kv_cache_unified::seq_keep (llama_seq_id seq_id) {
351
- auto & cells = v_cells[seq_to_stream[ seq_id] ];
352
- auto & head = v_heads[seq_to_stream[ seq_id] ];
351
+ auto & cells = v_cells[seq_to_stream. at ( seq_id) ];
352
+ auto & head = v_heads[seq_to_stream. at ( seq_id) ];
353
353
354
354
uint32_t new_head = cells.size ();
355
355
@@ -368,8 +368,8 @@ void llama_kv_cache_unified::seq_keep(llama_seq_id seq_id) {
368
368
}
369
369
370
370
void llama_kv_cache_unified::seq_add (llama_seq_id seq_id, llama_pos p0, llama_pos p1, llama_pos shift) {
371
- auto & cells = v_cells[seq_to_stream[ seq_id] ];
372
- auto & head = v_heads[seq_to_stream[ seq_id] ];
371
+ auto & cells = v_cells[seq_to_stream. at ( seq_id) ];
372
+ auto & head = v_heads[seq_to_stream. at ( seq_id) ];
373
373
374
374
if (shift == 0 ) {
375
375
return ;
@@ -410,7 +410,7 @@ void llama_kv_cache_unified::seq_add(llama_seq_id seq_id, llama_pos p0, llama_po
410
410
}
411
411
412
412
void llama_kv_cache_unified::seq_div (llama_seq_id seq_id, llama_pos p0, llama_pos p1, int d) {
413
- auto & cells = v_cells[seq_to_stream[ seq_id] ];
413
+ auto & cells = v_cells[seq_to_stream. at ( seq_id) ];
414
414
415
415
if (d == 1 ) {
416
416
return ;
@@ -441,13 +441,13 @@ void llama_kv_cache_unified::seq_div(llama_seq_id seq_id, llama_pos p0, llama_po
441
441
}
442
442
443
443
llama_pos llama_kv_cache_unified::seq_pos_min (llama_seq_id seq_id) const {
444
- const auto & cells = v_cells[seq_to_stream[ seq_id] ];
444
+ const auto & cells = v_cells[seq_to_stream. at ( seq_id) ];
445
445
446
446
return cells.seq_pos_min (seq_id);
447
447
}
448
448
449
449
llama_pos llama_kv_cache_unified::seq_pos_max (llama_seq_id seq_id) const {
450
- const auto & cells = v_cells[seq_to_stream[ seq_id] ];
450
+ const auto & cells = v_cells[seq_to_stream. at ( seq_id) ];
451
451
452
452
return cells.seq_pos_max (seq_id);
453
453
}
@@ -1842,7 +1842,7 @@ void llama_kv_cache_unified::state_read(llama_io_read_i & io, llama_seq_id seq_i
1842
1842
continue ;
1843
1843
}
1844
1844
1845
- const uint32_t strm = seq_id == -1 ? s : seq_to_stream[ seq_id] ;
1845
+ const uint32_t strm = seq_id == -1 ? s : seq_to_stream. at ( seq_id) ;
1846
1846
1847
1847
bool res = true ;
1848
1848
res = res && state_read_meta (io, strm, cell_count, seq_id);
0 commit comments