Training in progress, epoch 1

Browse files

Files changed (9) hide show

.gitignore +1 -0
config.json +153 -0
merges.txt +0 -0
pytorch_model.bin +3 -0
special_tokens_map.json +51 -0
tokenizer.json +0 -0
tokenizer_config.json +65 -0
training_args.bin +3 -0
vocab.json +0 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

config.json ADDED Viewed

	@@ -0,0 +1,153 @@

+{
+  "_name_or_path": "PlanTL-GOB-ES/roberta-base-bne",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Administraci\u00f3n Central",
+    "1": "Aseguradora",
+    "2": "Asuntos de la mujer",
+    "3": "Banco de la Rep\u00fablica",
+    "4": "Bienes nacionales",
+    "5": "Calamidades p\u00fablicas",
+    "6": "Comercio Exterior",
+    "7": "Constituci\u00f3n",
+    "8": "Control de calidad",
+    "9": "Control fiscal",
+    "10": "Corporaciones Aut\u00f3nomas Regionales",
+    "11": "Cultura",
+    "12": "Defensa Nacional",
+    "13": "Diplomacia",
+    "14": "Ecolog\u00eda",
+    "15": "Educaci\u00f3n",
+    "16": "Empr\u00e9stitos",
+    "17": "Energ\u00eda",
+    "18": "Espacio A\u00e9reo",
+    "19": "Establecimientos p\u00fablico",
+    "20": "Fondos de prestaciones",
+    "21": "Fronteras",
+    "22": "Fuerza P\u00fablica",
+    "23": "Hacienda",
+    "24": "Impuestos",
+    "25": "Inform\u00e1tica",
+    "26": "Investigaci\u00f3n cient\u00edfica",
+    "27": "Legislaci\u00f3n administrativa",
+    "28": "Leyes",
+    "29": "Medio ambiente",
+    "30": "Medios de comunicaci\u00f3n",
+    "31": "Mercado de Valores",
+    "32": "Miner\u00eda",
+    "33": "Monopolios",
+    "34": "Monumentos p\u00fablicos",
+    "35": "Nacionalidad",
+    "36": "Organismos de Control",
+    "37": "Organizaciones sindicales",
+    "38": "Organizaci\u00f3n Territorial",
+    "39": "Planeaci\u00f3n nacional",
+    "40": "Pol\u00edtica Internacional",
+    "41": "Pol\u00edtica portuaria",
+    "42": "Pol\u00edticas migratorias",
+    "43": "Prestaciones Servidores P\u00fablicos",
+    "44": "Presupuesto",
+    "45": "Propiedad intelectual",
+    "46": "Recreaci\u00f3n",
+    "47": "Recursos ictiol\u00f3gicos",
+    "48": "Regulaci\u00f3n econ\u00f3mica",
+    "49": "Reubicaci\u00f3n de entidades",
+    "50": "R\u00e9gimen Agropecuario",
+    "51": "Salud",
+    "52": "Seguridad Social",
+    "53": "Servicios p\u00fablicos",
+    "54": "Sin clasificaci\u00f3n",
+    "55": "Tierras",
+    "56": "Transporte",
+    "57": "Turismo",
+    "58": "Vivienda",
+    "59": "Zona franca"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administraci\u00f3n Central": 0,
+    "Aseguradora": 1,
+    "Asuntos de la mujer": 2,
+    "Banco de la Rep\u00fablica": 3,
+    "Bienes nacionales": 4,
+    "Calamidades p\u00fablicas": 5,
+    "Comercio Exterior": 6,
+    "Constituci\u00f3n": 7,
+    "Control de calidad": 8,
+    "Control fiscal": 9,
+    "Corporaciones Aut\u00f3nomas Regionales": 10,
+    "Cultura": 11,
+    "Defensa Nacional": 12,
+    "Diplomacia": 13,
+    "Ecolog\u00eda": 14,
+    "Educaci\u00f3n": 15,
+    "Empr\u00e9stitos": 16,
+    "Energ\u00eda": 17,
+    "Espacio A\u00e9reo": 18,
+    "Establecimientos p\u00fablico": 19,
+    "Fondos de prestaciones": 20,
+    "Fronteras": 21,
+    "Fuerza P\u00fablica": 22,
+    "Hacienda": 23,
+    "Impuestos": 24,
+    "Inform\u00e1tica": 25,
+    "Investigaci\u00f3n cient\u00edfica": 26,
+    "Legislaci\u00f3n administrativa": 27,
+    "Leyes": 28,
+    "Medio ambiente": 29,
+    "Medios de comunicaci\u00f3n": 30,
+    "Mercado de Valores": 31,
+    "Miner\u00eda": 32,
+    "Monopolios": 33,
+    "Monumentos p\u00fablicos": 34,
+    "Nacionalidad": 35,
+    "Organismos de Control": 36,
+    "Organizaciones sindicales": 37,
+    "Organizaci\u00f3n Territorial": 38,
+    "Planeaci\u00f3n nacional": 39,
+    "Pol\u00edtica Internacional": 40,
+    "Pol\u00edtica portuaria": 41,
+    "Pol\u00edticas migratorias": 42,
+    "Prestaciones Servidores P\u00fablicos": 43,
+    "Presupuesto": 44,
+    "Propiedad intelectual": 45,
+    "Recreaci\u00f3n": 46,
+    "Recursos ictiol\u00f3gicos": 47,
+    "Regulaci\u00f3n econ\u00f3mica": 48,
+    "Reubicaci\u00f3n de entidades": 49,
+    "R\u00e9gimen Agropecuario": 50,
+    "Salud": 51,
+    "Seguridad Social": 52,
+    "Servicios p\u00fablicos": 53,
+    "Sin clasificaci\u00f3n": 54,
+    "Tierras": 55,
+    "Transporte": 56,
+    "Turismo": 57,
+    "Vivienda": 58,
+    "Zona franca": 59
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.28.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50262
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd653170e7d109e70c06be3550e776c27a64287b834a8cfa06f11008e9699864
+size 498831221

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "max_len": 512,
+  "model_max_length": 512,
+  "pad_token": {
+    "__type": "AddedToken",
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5dec6dac39712a1490856e2faf2a9efabb3b8140641a2bdf5e93dc3436437e8b
+size 3579

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff