Tokenización digráfica
| Límite de tiempo | 1000 ms |
|---|---|
| Límite de memoria | 128 MiB |
La tokenización es «el proceso de dividir una secuencia de caracteres en unidades significativas llamadas tokens». Una forma básica (y aún usada) de tokenización es dividir las palabras en digrafos. Por ejemplo hola se divide en en ho, ol y la.
Se te darán cadenas, y consultas con un digrafo. Debes responder cada consulta con la cantidad de palabras que contienen ese digrafo.
Entrada
Una línea con dos enteros y (), la cantidad de palabras y de consultas respectivamente.
Una línea con n palabras, cada una compuesta por letras minúsculas y de tamaño entre 4 a 20.
Luego líneas, cada una con un dígrafo de tamaño 2 (dos letras minúsculas).
Salida
Para cada consulta, imprime un entero: la cantidad de palabras que contienen el dígrafo consultado.
Ejemplo
| Entrada | Salida |
|---|---|
|
|