- Guangzhou, China
-
entity_extractor_by_ner Public
基于Tensorflow2.3开发的NER模型,都是CRF范式,包含Bilstm(IDCNN)-CRF、Bert-Bilstm(IDCNN)-CRF、Bert-CRF,可微调预训练模型,可对抗学习,用于命名实体识别,配置后可直接运行。
-
text_classifier_torch Public
Text classification repository built with Torch, featuring training tricks, acceleration methods, and model optimization techniques like distillation, compression, and pruning. Supports single-labe…
-
text_classifier_tf2 Public
Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。
-
-
text_embedding Public
一个用于训练句子embedding的工具,支持Cosent以及Simcse
-
entity_extractor_by_pointer Public
使用torch整合两种经典的指针NER抽取范式,分别是SpanBert和苏神的GlobalPointer,简单加了些tricks,配置后一键运行
-
bert_nlu_joint Public
一个使用tensorflow2.3开发的基于Bert的意图识别的自然语言理解任务Demo
-
nlu_torch Public
意图槽位模型训练框架(单意图、独立槽位),使用的是JointBERT的结构进行编写,槽位提取时可以选择双指针(Binary Pointer)实体抽取和Global Pointer两种方法。
-
entity_extractor Public
基于torch的,支持logits、crf、span、global_pointer四种方法的命名实体识别任务框架
-
-
llms_tool Public
一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测,低参数量及全参数模型训练(预训练、SFT、RM、PPO、DPO)和融合、量化。
-
-
-
-
-
image_classification Public
常用的一些用于图像分类的模型demo。
-
-
seq2seq Public
基于Tensorflow官方教程的基于注意力的神经机器翻译重构的代码,使用Seq2Seq做机器翻译和摘要生成代码仓库。使用Tensorflow2.3进行构建。
-
使用transformer模型进行文本的分类,基于Tensorflow2.3开发
-
-
-
-
app_comments_spider Public
爬取百度贴吧、TapTap、appstore、微博官方博主上的游戏评论(基于redis_scrapy),过滤器采用了bloomfilter。