9. 独立分量分析(ICA)
10. 局部线性嵌入(LLE)
11. IOSMAP
12. t-SNE
13. UMAP
14. Autoencoder
15. Lap lacian Eigenmap
(1)xgb和gbdt效果上的区别:
(2)xgb和gbdt在处理缺失值时的区别:
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
Adam 优化算法应用在非凸优化问题中所获得的优势:
(1) kmeans 主要针对圆形或球形样本进行聚类,对于椭圆数据处理效果不佳,而 GMM 可以解决这个问题。
(2) kmeans 对于不均衡的样本类别聚类效果不佳,而 GMM 计算过程则考虑了各类别权重。
(3) kmeans 是判别模型,直接对样本空间中寻找最有面进行划分,可解释性不强。GMM 是生成模型,从样本本身分布出发,计算联合概率分布,以求得分类结果,可解释性比 kmeans 强。
(4) kmeans 是硬分类,结果属于0-1;而 GMM 是软分类,分类结果是一个概率分布。
神经网络学习又称为神经元的基本处理单元互连而成的平行工作的复杂网络系统,简称神经网络。当已知训练样本的数据加到网络输入端时,网络的学习机制一遍又一遍地调整各神经元的权值,使其输出端达到预定的目标。
这就是训练(学习、记忆)过程。
神经网络原理及应用:
1. 什么是神经网络?
神经网络是一种模拟动物神经网络行为特征,进行分布式并行信息处理的算法。
这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
2. 神经网络基础知识构成:大量简单的基础元件——神经元相互连接
工作原理:模拟生物的神经处理信息的方式
功能:进行信息的并行处理和
非线性转化特点:比较轻松地实现非线性映射过程,具有大规模的计算能力
神经网络的本质:神经网络的本质就是利用计算机语言模拟人类大脑做决定的过程。
3. 生物神经元结构
4. 神经元结构模型 xj 为输入信号,θi 为阈值,wij 表示与神经元连接的权值,yi 表示输出值判断 xjwij 是否大于阈值 θi
5. 什么是阈值?
临界值。神经网络是模仿大脑的神经元,当外界刺激达到一定的阈值时,神经元才会受刺激,影响下一个神经元。
6. 几种代表性的网络模型单层前向神经网络——线性网络阶跃网络多层前向神经网络(反推学习规则即BP神经网络)Elman网络、Hopfield网络、双向联想记忆网络、自组织竞争网络等等.
7. 神经网络能干什么/应用 ?
运用这些网络模型可实现函数逼近、数据聚类、模式分类、优化计算等功能。因此,神经网络广泛应用于人工智能、自动控制、机器人、统计学等领域的信息处理中。
虽然神经网络的应用很广,但是在具体的使用过程中到底应当选择哪种网络结构比较合适是值得考虑的。这就需要我们对各种神经网络结构有一个较全面的认识。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
定义一个均值函数。
#计算均值,要求输入数据为numpy的矩阵格式,行表示样本数,列表示特征
def meanX(dataX):
return np.mean(dataX,axis=0)#axis=0表示依照列来求均值。假设输入list,则axis=1
开始实现 pca 的函数:
def pca(XMat, k):
"""
XMat:传入的是一个numpy的矩阵格式,行表示样本数,列表示特征
k:表示取前k个特征值相应的特征向量
finalData:指的是返回的低维矩阵
reconData:相应的是移动坐标轴后的矩阵
"""
average = meanX(XMat)
m, n = np.shape(XMat)
data_adjust = []
avgs = np.tile(average, (m, 1))
data_adjust = XMat - avgs
covX = np.cov(data_adjust.T) #计算协方差矩阵
featValue, featVec= np.linalg.eig(covX) #求解协方差矩阵的特征值和特征向量
index = np.argsort(-featValue) #依照featValue进行从大到小排序
finalData = []
if k > n:
print("k must lower than feature number")
return
else:
#注意特征向量时列向量。而numpy的二维矩阵(数组)a[m][n]中,a[1]表示第1行值
selectVec = np.matrix(featVec.T[index[:k]]) #所以这里须要进行转置
finalData = data_adjust * selectVec.T
reconData = (finalData * selectVec) + average
return finalData, reconData
1.将远程的某个目录设置为共享转载见
2.通过命令行
@echo off
net use \\192.168.1.2\ipc$ password /user:Administrator
rem 复制单个文件 (可以执行其他诸如del等的命令)
copy D:\setup.bat \\192.168.1.2\temp
rem 复制文件夹 /s 复制非空的目录和子目录。如果省略 /s,xcopy 将在一个目录中工作。 /e 复制所有子目录,包括空目录。同时使用 /e、/s 和 /t 命令行选项。
rem XCOPY D:\TEMP \\192.168.1.2\temp/E
net use \\192.168.1.2\ipc$ /delete
pause
Linux 查看日志文件内容命令有:
你可以使用 man [命令]来查看各个命令的使用文档,如 :man cp。
阅读量:886
点赞量:0
收藏量:0