精彩博客

让你彻底记住什么是ROC/AUC(看不懂你来找我)

机器学习:ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是好多朋友都遇到了一个相同的问题,那就是:每次看书的时候都很...

昨天 17:46
196
1
劲爆︱开源众包和公安行业强强联手,推出系列好项目。

公安行业的项目第一期出来了。要求可能有点高。但是稳定,优质,更有场面!

众包广告

deeplearning4j——卷积神经网络对验证码进行识别

一、前言 计算机视觉长久以来没有大的突破,卷积神经网络的出现,给这一领域带来了突破,本篇博客,将通过具体的实例来看看卷积神经网络在图像识别上的应用。 导读 1、问题描述 2、解决问题的...

10/09 20:02
468
1
ND4J的基本操作

一、ND4J的在内存中的存储结构 对于ND4J而言,所有的数据都存储在堆外内存,是一维的连续内存,INDArray 只是指向了这片连续的内存空间,把连续内存映射成张量,ND4J定义了两种排序规则:C o...

10/08 19:53
197
0
深度有趣 | 18 二次元头像生成

简介 和CelebA类似,使用ACGAN生成二次元头像,并且用多个条件进行控制 数据 图片爬取自http://getchu.com/,是一个日本二次元游戏网站,包含大量游戏人物立绘,共爬取31,970张 头像截取 之前...

09/20 20:08
209
3
KubeCon+CloudNativeCon 2018中国论坛震撼来袭,邀您共享云原生盛宴

2018年11月13-15日,由云原生计算基金会 (CNCF) 主办的全球顶级的Kubernetes官方技术论坛KubeCon+CloudNativeCon 2018中国 将在上海跨国采购会展中心隆重举行。 本次论坛将设置快闪演讲、主...

09/07 12:35
1K
4
【AI实战】快速掌握TensorFlow(四):损失函数

在前面的文章中,我们已经学习了TensorFlow激励函数的操作使用方法(见文章:快速掌握TensorFlow(三)),今天我们将继续学习TensorFlow。 本文主要是学习掌握TensorFlow的损失函数。 一、什...

09/02 00:24
540
2
[pytorch] 从易到难解决 MNIST 问题

MNIST 可谓是机器学习的入门必讲的问题了。MNIST 数据集包含了手写的 0-9 的图片,其中有一个训练数据集和一个测试数据集。本文就采用“从易到难”的三种不同的模型,不断提升机器学习的正确...

08/23 15:37
325
1
概率软逻辑(PSL,Probabilistic soft logic)通用(可处理中文)版本

一、简介 概率软逻辑(PSL,Probabilistic soft logic)是用于开发概率模型的机器学习框架,由加州大学圣克鲁兹分校和马里兰大学的统计关系学习小组LINQS开发。目前其复杂的环境构建方式和G...

08/14 23:21
127
0
【AI实战】动手训练自己的目标检测模型(YOLO篇)

在前面的文章中,已经介绍了基于SSD使用自己的数据训练目标检测模型(见文章:手把手教你训练自己的目标检测模型),本文将基于另一个目标检测模型YOLO,介绍如何使用自己的数据进行训练。 ...

08/14 18:49
728
0
【AI实战】手把手教你训练自己的目标检测模型(SSD篇)

目标检测是AI的一项重要应用,通过目标检测模型能在图像中把人、动物、汽车、飞机等目标物体检测出来,甚至还能将物体的轮廓描绘出来,就像下面这张图,是不是很酷炫呢,嘿嘿 在动手训练自己...

08/14 00:32
746
1
Qt封装百度人脸识别+图像识别

AI技术的发展在最近几年如火如荼,工资待遇也是水涨船高,应用的前景也是非常广阔,去年火起来的人脸识别,今年全国遍地开花,之前封装了下face++的人脸识别等接口,今年看了下百度的AI,还免...

08/13 22:00
786
0
【AI实战】训练第一个AI模型:MNIST手写数字识别模型

在上篇文章中,我们已经把AI的基础环境搭建好了(见文章:Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基础环境),接下来将基于tensorflow训练第一个AI模型:MNIST手写数字识别模型。...

08/11 00:41
501
0
【AI实战】基础环境搭建(Ubuntu+conda+tensorflow+GPU+PyCharm)

为方便日常的深度学习模型开发与测试,在自己笔记本上搭建一个深度学习的基础环境,便于学习AI使用。本人使用的笔记本配置是CPU为8代i5,显卡为GTX1060,内存为8G,基本上可满足日常的AI研究...

08/08 23:56
980
3
白话深度神经网络

近些年来,深度神经网络异常火爆,各种深度神经网络架构层出不穷。大有千树万树梨花开,各领风骚数小时的趋势! 但不管它结构如何改变,层数如何增加,始终离不开最基本的游戏规则:1.承载计...

07/31 23:25
966
0
准确实用,7个优秀的开源中文分词库推荐

中文分词是中文文本处理的基础步骤,也是中文人机自然语言交互的基础模块。由于中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词。 纵观整个开源领域,陆陆续续做...

07/25 19:05
3.9K
11
对基于深度神经网络的Auto Encoder用于异常检测的一些思考

一、前言 现实中,大部分数据都是无标签的,人和动物多数情况下都是通过无监督学习获取概念,故而无监督学习拥有广阔的业务场景。举几个场景:网络流量是正常流量还是攻击流量、视频中的人的...

07/23 23:36
745
1
ND4J求多元线性回归以及GPU和CPU计算性能对比

上一篇博客《梯度下降法求多元线性回归及Java实现》简单了介绍了梯度下降法,并用Java实现了一个梯度下降法求回归的例子。本篇博客,尝试用dl4j的张量运算库nd4j来实现梯度下降法求多元线性回...

07/17 19:39
392
0
梯度下降法求多元线性回归及Java实现

对于数据分析而言,我们总是极力找数学模型来描述数据发生的规律, 有的数据我们在二维空间就可以描述,有的数据则需要映射到更高维的空间。数据表现出来的分布可能是完全离散的,也可能是聚...

07/17 19:28
1K
8
如何用遗传算法进化出一只聪明的小鹦鹉

问题 现在有一些样本数据,如下表所示。你是否能找到其中的规律,然后计算出新样本的output是多少? input output 样本1 5, 8, 7 9 样本2 2, 8, 4 6 样本3 3, 0, 5 3 样本4 9, 12, ...

07/16 21:44
16
0
妈妈再也不用担心爬虫被封号了!手把手教你搭建Cookies池

很多时候,在爬取没有登录的情况下,我们也可以访问一部分页面或请求一些接口,因为毕竟网站本身需要做SEO,不会对所有页面都设置登录限制。 但是,不登录直接爬取会有一些弊端,弊端主要有以...

06/26 10:50
1K
5

没有更多内容

加载失败,请刷新页面

劲爆︱开源众包和公安行业强强联手,推出系列好项目。

公安行业的项目第一期出来了。要求可能有点高。但是稳定,优质,更有场面!

众包广告

Node.js股票模拟交易后台

我曾经花了一周时间开发了一个股票模拟交易后台程序,使用Node.js。代码量很少,能完成基本功能。下面给大家介绍一下其实现步骤。 基本功能 开户 搜索股票 挂单(多单、空单) 撤单(主动、被...

10/13 22:37
1K
3
前端安全系列之二:如何防止CSRF攻击?

背景 随着互联网的高速发展,信息安全问题已经成为企业最为关注的焦点之一,而前端又是引发企业安全问题的高危据点。在移动互联网时代,前端人员除了传统的 XSS、CSRF 等安全问题之外,又时常...

10/12 10:43
2.7K
21
从源码分析如何优雅的使用 Kafka 生产者

前言 在上文 设计一个百万级的消息推送系统 中提到消息流转采用的是 Kafka 作为中间件。 其中有朋友咨询在大量消息的情况下 Kakfa 是如何保证消息的高效及一致性呢? 正好以这个问题结合 Ka...

10/11 08:13
1K
4
Go 内存管理

1. 前言 编写过C语言程序的肯定知道通过malloc()方法动态申请内存,其中内存分配器使用的是glibc提供的ptmalloc2。 除了glibc,业界比较出名的内存分配器有Google的tcmalloc和Facebook的jem...

10/09 16:55
1K
14
关于MySQL 通用查询日志和慢查询日志分析

MySQL中的日志包括:错误日志、二进制日志、通用查询日志、慢查询日志等等。这里主要介绍下比较常用的两个功能:通用查询日志和慢查询日志。 1)通用查询日志:记录建立的客户端连接和执行的...

10/09 14:36
2.6K
5
使用golang写一个redis-cli

使用golang写一个redis-cli 0. redis通信协议 redis的客户端(redis-cli)和服务端(redis-server)的通信是建立在tcp连接之上, 两者之间数据传输的编码解码方式就是所谓的redis通信协议。所以,...

10/08 19:23
2.6K
7
揭密 Vue 的双向绑定

Vue 中需要输入什么内容的时候,自然会想到使用 的方式来实现双向绑定。下面是一个最简单的示例 What's your name:

10/05 11:31
2.1K
5
谈谈机器学习模型的部署

随着机器学习的广泛应用,如何高效的把训练好的机器学习的模型部署到生产环境,正在被越来越多的工具所支持。我们今天就来看一看不同的工具是如何解决这个问题的。 上图的过程是一个数据科学...

10/05 03:00
975
2
iOS 的组件化开发

在一个APP开发过程中,如果项目较小且团队人数较少,使用最基本的MVC、MVVM开发就已经足够了,因为维护成本比较低。 但是当一个项目开发团队人数较多时,因为每个人都会负责相应组件的开发,...

10/03 22:59
530
0
jvm误区--动态对象年龄判定

虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可...

09/29 20:01
955
1
为什么我们做分布式使用Redis?

绝大部分写业务的程序员,在实际开发中使用 Redis 的时候,只会 Set Value 和 Get Value 两个操作,对 Redis 整体缺乏一个认知。这里对 Redis 常见问题做一个总结,解决大家的知识盲点。 1、...

09/29 16:03
6.3K
20
似懂非懂 Comparable和 Comparator

在java中提供了两种排序方式:Comparable和 Comparator,它们两个看起来非常的相似,在不是很了解的情况下不知道如何使用,什么情况下使用哪个进行排序,接下来就看下它们的一个区别和使用方...

09/29 10:51
1K
3
快速了解 Git Git仓库

一、Git介绍 (1)Git是一个开源(Linus Torvalds 为了帮助管理 Linux 内核开发而开发)的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目,与常用的版本控制工具 CVS, SVN等不同...

09/28 15:38
1K
4
SpringBoot | 第二十九章:Dubbo的集成和使用

前言 今年年初时,阿里巴巴开源的高性能服务框架dubbo又开始了新一轮的更新,还加入了Apache孵化器。原先项目使用了spring cloud之后,已经比较少用dubbo。目前又抽调回原来的行业应用部门,...

09/28 09:39
2.2K
5
聊聊 Go Socket 框架 Teleport 的设计思路

项目源码 teleport:https://github.com/henrylee2cn/teleport 背景 大家在进行业务开发时,是否是否遇到过下列问题,并且无法在Go语言开源生态中找到一套完整的解决方案? 高性能、可靠地通...

09/27 10:05
1K
3
微服务写的最全的一篇文章

今年有人提出了2018年微服务将疯狂至死,可见微服务的争论从未停止过。在这我将自己对微服务的理解整理了一下,希望对大家有所帮助。 1.什么是微服务 1)一组小的服务(大小没有特别的标准,...

09/26 22:46
4K
34
EventBus原理深度解析

一、问题描述 在工作中,经常会遇见使用异步的方式来发送事件,或者触发另外一个动作:经常用到的框架是MQ(分布式方式通知)。如果是同一个jvm里面通知的话,就可以使用EventBus。由于Event...

09/26 01:29
2.9K
10
设计一个百万级的消息推送系统

前言 首先迟到的祝大家中秋快乐。 最近一周多没有更新了。其实我一直想憋一个大招,分享一些大家感兴趣的干货。 鉴于最近我个人的工作内容,于是利用这三天小长假憋了一个出来(其实是玩了两...

09/25 08:30
4.9K
13
缓存架构之史上讲的最明白的RabbitMQ可靠消息传输实战演练

缓存架构之史上讲的最明白的RabbitMQ可靠消息传输实战演练 一、背景介绍:消息可靠传递的重要性 比如:某个广告主(如:天猫)想在我们的平台(如:今日头条)投放广告,当通过我们的广告系统...

09/23 15:28
5.1K
20
如何通过 J2Cache 实现分布式 session 存储

做 Java Web 开发的人多数都会需要使用到 session (会话),我们使用 session 来保存一些需要在两个不同的请求之间共享数据。一般 Java 的 Web 容器像 Tomcat、Resin、Jetty 等等,它们会在...

09/21 01:28
1K
6

没有更多内容

加载失败,请刷新页面

让你彻底记住什么是ROC/AUC(看不懂你来找我)

机器学习:ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是好多朋友都遇到了一个相同的问题,那就是:每次看书的时候都很...

昨天 17:46
196
1
Python 的经典设计格言,格言来源于 Python 但不限于 Python

美丽优于丑陋。 清楚优于含糊。 简单优于复杂。 复杂优于繁琐。 平坦优于曲折。 宽松优于密集。 重要的是可读性。 特殊的案例不足以特殊到破坏规则。 尽管实践可以打破真理。 错误却不可置之...

昨天 14:35
7
0
MapReduce实现与自定义词典文件基于hanLP的中文分词详解

文本分类任务的第1步,就是对语料进行分词。在单机模式下,可以选择python jieba分词,使用起来较方便。但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则hanLP更加胜任。 一、使用...

昨天 10:26
7
0
tf-idf的实现

#改变batch_size 和max_features的值影响图像的形状 import tensorflow as tf import matplotlib.pyplot as plt import csv import numpy as np import string import os from zipfile impor...

前天 13:59
4
0
【TensorFlow源码系列】【二】DirectSession::Run

DirectSession::Run // 1. 依据feed/fetch/full_graph来创建一个executor,负责图的运行 GetOrCreateExecutors CreateExecutors // 1.1 先依据创建一个可执行的graph--client_graph CreateG...

10/13 21:25
5
0
基本用法

import tensorflow as tf import numpy as np sess = tf.Session() data_size = 25 data_ld = np.random.normal(size=data_size) x_input_id = tf.placeholder(dtype=tf.float32,shape=[data...

10/13 15:42
2
0
简单神经网络

import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from sklearn import datasets from tensorflow.python.framework import ops ops.reset_default_graph() ses...

10/13 12:44
3
0
Hanlp等七种优秀的开源中文分词库推荐

中文分词是中文文本处理的基础步骤,也是中文人机自然语言交互的基础模块。由于中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词。 纵观整个开源领域,陆陆续续做...

10/12 09:49
4
0
【TensorFlow源码系列】【零】使用TensorFlow C++ 接口进行模型推理

#include <string> #include <vector> #include <iostream> #include "tensorflow/core/public/session.h" #include "tensorflow/core/framework/tensor.h" //using namespace std; //using ...

10/11 22:00
5
0
AI 的下一个重大挑战:理解语言的细微差别

简评:人类语言非常博大精妙,同一句话在不同的语境下,就有不同的含义。连人类有时候都不能辨别其中细微的差别,机器能吗?这就是人工智能的下一个巨大挑战:理解语言的细微差别。本文原作者...

10/11 10:15
3
0
大数据、机器学习和深度学习类命令行工具

在 OSX 和 LInux 上无需使用鼠标或 GUI ,也可以完成大量的操作。极具人气的面向各类 N X系统的命令行工具目前已经扩展至Python、Go、NodeJS 乃至各类混合型工具当中。即使您并不打算通过命令...

10/10 17:36
9
0
使用 xlwt 生成的 excel 文件单元格的中文是乱码

系统是 Mac, 用的是 Office 2011,python 安装了 xlwt 代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- import xlwt file = xlwt.Workbook(encoding = 'utf-8') table = file.ad...

10/10 17:15
3
0
singmod 与relu损失函数的比较

import matplotlib.pyplot as plt import numpy as np import tensorflow as tf sess = tf.Session() tf.set_random_seed(5) np.random.seed(42) batch_size = 50 a1 = tf.Variable(tf.rando...

10/10 16:08
7
0
车牌识别-Mask_RCNN定位车牌+手写方法分割字符+CNN单个字符识别

simple-car-plate-recognition 简单车牌识别-Mask_RCNN定位车牌+手写方法分割字符+CNN单个字符识别 数据准备 准备用于车牌定位的数据集,要收集250张车辆图片,200张用于训练,50张用于测试,...

10/10 14:52
26
0
稀疏矩阵算法

什么是稀疏矩阵 将矩阵中的元素按照零和非零分为两个集合,对于零元素,其占整个矩阵的元素个数比成为稠密度。 稠密度 > 0.05 稠密矩阵 稠密度 < 0.05 稀疏矩阵 稀疏矩阵算法 通过压缩稀疏矩...

10/10 10:49
8
0
HanLP代码与词典分离方案与流程

之前在spark环境中一直用的是portable版本,词条数量不是很够,且有心想把jieba,swcs词典加进来, 其他像ik,ansi-seg等分词词典由于没有词性并没有加进来. 本次修改主要是采用jar包方包将词典...

10/10 09:18
8
0
【TensorFlow源码系列】【一】Session的创建

【一】代码下载 https://github.com/tensorflow/tensorflow/releases/ PS:本次源码分析采用1.11版本 【二】Session简介 在TensorFlow中,session是沟通tf的桥梁,模型的训练、推理,都需要通...

10/09 20:42
10
0
GBDT

Gradient Boosting Decision Tree 梯度提升决策树 https://blog.csdn.net/shine19930820/article/details/65633436...

10/09 20:25
4
0
deeplearning4j——卷积神经网络对验证码进行识别

一、前言 计算机视觉长久以来没有大的突破,卷积神经网络的出现,给这一领域带来了突破,本篇博客,将通过具体的实例来看看卷积神经网络在图像识别上的应用。 导读 1、问题描述 2、解决问题的...

10/09 20:02
468
1
机器学习(一)——K-近邻(KNN)算法

最近在看《机器学习实战》这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,就在朋友的推荐之下选择了这本书进行学习。 一 . K-近邻算法(KNN)概述 最简单最初级的分类器是...

10/09 14:59
6
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部