ggml_flash_attn method
Pointer<ggml_tensor>
ggml_flash_attn(
- Pointer<
ggml_context> ctx, - Pointer<
ggml_tensor> q, - Pointer<
ggml_tensor> k, - Pointer<
ggml_tensor> v, - bool masked,
Implementation
ffi.Pointer<ggml_tensor> ggml_flash_attn(
ffi.Pointer<ggml_context> ctx,
ffi.Pointer<ggml_tensor> q,
ffi.Pointer<ggml_tensor> k,
ffi.Pointer<ggml_tensor> v,
bool masked,
) {
return _ggml_flash_attn(
ctx,
q,
k,
v,
masked,
);
}