电影知识图谱问答(五)| 基于微信公众号的电影知识图谱问答Demo

通过【电影知识图谱问答(一)|爬取豆瓣电影与书籍详细信息、电影知识图谱问答(二)|生成298万条RDF三元组数据、电影知识图谱问答(三)|Apache Jena知识存储及SPARQL知识检索、电影知识图谱问答(四)| 问句理解及答案推理】四篇文章的介绍,我们已经了解如何从豆瓣官网中爬取数据;如何将爬取的数据转换得到可用的三元组数据,并存储至Apache Jena之中;如何利用SPARQL查询语言进

- 阅读全文 -

电影知识图谱问答(四)| 问句理解及答案推理

上篇文章电影知识图谱问答(三)|Apache Jena知识存储及SPARQL知识检索中讲到如何将处理后的RDF数据存储至Apache Jena数据库之中、如何利用SPARQL语句从Apache Jena之中进行知识检索和答案推理。本篇文章将主要介绍如何理解问句所表达的深层语义含义、如何将自然语言问句转换成SPARQL查询语句、如何进行答案推理。上篇文章讲到利用SPARQL语句能够从Apache J

- 阅读全文 -

电影知识图谱问答(三)|Apache Jena知识存储及SPARQL知识检索

上篇文章电影知识图谱问答(二)|生成298万条RDF三元组数据中讲到如何将爬取得到的豆瓣电影和书籍数据转换成知识图谱所需的RDF类型数据,本篇文章将介绍如何将得到的298万条RDF类型数据存储到知识图谱数据库之中,并介绍如何利用SPARQL进行知识检索。实践之前,请自主学习Apache Jena, Apache Fuseki, SPARQL相关知识。1. 知识图谱数据库既然是要存储三元组数据,那选

- 阅读全文 -

电影知识图谱问答(二)|生成298万条RDF三元组数据

上篇文章讲到如何爬取豆瓣官网的电影和书籍类别数据,本篇文章将学习如何利用爬取的数据,构建知识图谱所需的三元组。主要内容包括如何从Json类型的数据,转换成RDF数据。数据链接: https://pan.baidu.com/s/1cLdsAXLGH2akJqMIsGdoig 提取码: n97y。实践之前,请自主学习相关背景知识。语义网络, 语义网, 链接数据, 知识图谱是什么。RDF, RDFS,

- 阅读全文 -

电影知识图谱问答(一)|爬取豆瓣电影与书籍详细信息

最近在做关于知识图谱方面的实验,需要一些数据,于是爬取了豆瓣上关于电影和书籍的信息。两天时间内共爬取20W+条数据,包括电影信息、电影演员信息、书籍信息、书籍作者信息,GitHub链接为https://github.com/weizhixiaoyi/DouBan-Spider。1. 数据说明电影信息包括电影id、图片链接、名称、导演名称、编剧名称、主演名称、类型、制片国家、语言、上映日期、片长、季

- 阅读全文 -

Ununtu16.04搭建GitLab服务器教程

Ununtu16.04搭建GitLab服务器教程GitLab官方搭建教程地址: https://about.gitlab.com/install/#ubuntu1.依赖包安装sudo apt-get update sudo apt-get install -y curl openssh-server ca-certificates执行完成后,邮件配置时选择Internet即可.2.GitLab安装

- 阅读全文 -

详解准确率、精确率、召回率、F1值等评价指标的含义

机器学习问题之中,通常需要建立模型来解决具体问题,但对于模型的好坏,也就是模型的泛化能力,如何进行评估呢?很简单,我们可以定一些评价指标,来度量模型的优劣。比如准确率、精确率、召回率、F1值、ROC、AUC等指标,但是你清楚这些指标的具体含义吗?下面我们一起来看看吧。1.混淆矩阵介绍各个指标之前,我们先来了解一下混淆矩阵。假如现在有一个二分类问题,那么预测结果和实际结果两两结合会出现如下四种情况。

- 阅读全文 -

机器学习降维之线性判别模型(LDA)

1.LDA简介线性判别分析(Linear Discriminant Analysis, LDA)是一种监督学习的降维方法,也就是说数据集的每个样本是有类别输出。和之前介绍的机器学习降维之主成分分析(PCA)方法不同,PCA是不考虑样本类别输出的无监督学习方法。LDA的原理简单来说就是将带上标签的数据(点),通过投影的方法,投影到维度更低的空间中,使得投影后的点会形成按类别区分。而我们的目标就是使得

- 阅读全文 -

机器学习降维之奇异值分解(SVD)

奇异值分解(Singular Value Decompostion, SVD)是在机器学习领域广泛应用的算法,不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石。本篇文章对SVD原理做主要讲解,在学习之前,确保你已经熟悉线性代数中的基本知识,包括特征值、特征向量、相似矩阵相关知识点。如果不太熟悉的话,推荐阅读如下两篇文章,如何理解矩阵特征值?知乎

- 阅读全文 -

机器学习降维之主成分分析(PCA)

主成分分析(Principal components analysis, PCA)是最重要的降维方法之一,在数据压缩、消除冗余和数据噪音消除等方面有广泛的应用。通常我们提到降维算法,最先想到的就是PCA,下面我们对PCA原理进行介绍。1. PCA思想PCA就是找出数据中最主要的方面,用数据中最重要的方面来代替原始数据。假如我们的数据集是n维的,共有m个数据(x1,x2,...,xm),我们将这m个

- 阅读全文 -

最新文章

最近回复

  • fushengwuyu: 博主你好,看了你的教程,收益良多,十分感谢。有个小问题,我启动f...
  • 谓之小一: 你好,我以前在ubuntu上也遇见过这个问题. 解决办法貌似是为...
  • walle: 您好,使用D2RQ(win10)时: 错误: 找不到或无法加载...
  • manyangyang: json2mysql部分有一些数据导入不到sql中,数据库中有些...
  • manyangyang: json2mysql部分有一些数据导入不到sql中,数据库中有些...
  • manyangyang: json2mysql部分有一些数据导入不到sql中,数据库中有些...
  • 谓之小一: 你好,所有代码都放在https://github.com/wei...
  • momo: 可以分享一下mysql数据吗
  • momo: 可以分享一下利用pymysql将Json类型数据导入到MySQL...
  • 在 2018年12月 发布的文章 - 大专栏: [...]后端前端人工智能DevOps移动端测试程序人生 ...

分类

标签

归档

其它