当前位置:首页 > IT技术 > 系统服务 > 正文

Brat标注工具安装及使用(虚拟机系统Ubuntu16)
2022-03-06 18:10:28

原文地址https://blog.csdn.net/p_jinsan/article/details/96152078

稍作了一些补充

1.环境
windows10->虚拟机->Ubuntu 16.04 64位

2.前置条件

  2.1更新apt

sudo apt upgrade
sudo apt update

  2.2安装git

sudo apt install git

  2.3安装apache2

sudo apt install apache2

检测:浏览器中输入http://127.0.0.1/或者http://localhost/
进入下图界面,则说明安装成功

 

  2.4安装google chrome#个人习惯

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

3.安装

  3.1下载brat

进入主页下载 http://brat.nlplab.org/index.html

 

补充:点击Download,像我就出现了无法连接的情况,可以将下载地址复制到迅雷进行下载

http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz

 

 

 

  3.2解压

tar xzf 路径/文件名
eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz

  3.3进入文件夹

重命名为brat

cd brat

  3.4安装,配置一些用户信息

./install.sh

  3.5打开#每次使用都需要

python2 standalone.py

  3.6打开浏览器进入即可开始标注

http://127.0.0.1:8001/index.xhtml

4.使用

  4.1登录后,选中文本后会弹出窗口,选择实体类型
  4.2拖动标注好的实体可以连接关系
  4.3双击标签可对标签进行修改或删除
  4.4点击data可导出标注好的数据
  ps:未登录不能进行标注

 

 

 

 

5.配置

annotation.conf

1.entities用来定义标注的实体名称,其格式为每行一个实体类型,
    比如:人名、地名、英雄名、技能名等,可以采用tab来增加二级标注,
    hero
        hero1
2.relations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型,
    随后是用逗号分隔的ArgNrelations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型,
    随后是用逗号分隔的ArgN:实体名,用来表示关系的各个相关者。
    relation1 Arg1:hero1, Arg2:hero1
3.events用来定义事件,每行定义一类事件,第一列为事件名,随后是用逗号分隔的Participant:实体名,
    用来表示事件的各个参与者。
4.attributes用来定义属性,每行一个属性,第一列为属性名,随后是用逗号分隔的Arg:<模块类型>, Value:属性值,
    注意属性值可以有多个

 

 visual.conf#视觉配置文件

1.采用中文标签时需要
2.将annotation.conf中名称替换
3.labels
    [labels]
    hero1 | 魏

 

 6.其他

  6.1中文支持

添加

n = re.sub(u'[^a-zA-Zu4e00-u9fa5<>,0-9_-]', '_', n)

到./server/src/projectconfig.py第163行

 

  6.2给.txt文件添加.ann的标引文件

find 文件夹名称 -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch
eg:find data/exa -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch

给文件夹内所有.txt文件添加对应的.ann标引文件

6.3添加用户(本地不需要)

直接在config.py文件中添加

USER_PASSWORD = { 
    'admn': 'admin', 
    'test': 'test', 
    #'user':'password',
    # (add USERNAME:PASSWORD pairs below this line.) 
}

7.参考

中文文本标注工具调研以及BRAT安装使用

标注工具Brat安装(本地)

本文摘自 :https://www.cnblogs.com/