Fork me on GitHub

AI 开源项目分享:pytorch 增强图像数据、Tensorflow 2.0 实现...

文末免费送电子书:七月在线干货组最新 升级的《名企AI面试100题》免费送!

项目一:igel — 无需编写代码即可训练,测试和使用模型

一个令人愉悦的机器学习工具,可让您无需编写代码即可训练/拟合,测试和使用模型。

该项目的目标是为技术用户和非技术用户提供机器学习。

有时我需要一个工具,可以用来快速创建机器学习原型。是构建概念验证还是创建快速草图模型来证明这一点。我发现自己经常被困在编写样板代码和/或想太多如何启动它。

因此,我决定创建igel。希望它将使技术和非技术用户更轻松地构建机器学习模型。

igel建立在scikit-learn之上。它提供了一种无需编写任何代码即可使用机器学习的简单方法。

您所需要的只是一个yaml(或json)文件,您需要在其中描述您要执行的操作。而已!

Igel支持sklearn的所有机器学习功能,无论是回归,分类还是聚类。准确地说,您可以在igel中使用63种不同的机器学习模型。

Igel支持数据科学领域中最常用的数据集类型。例如,您的输入数据集可以是您要获取的csv,txt,excel表格,json甚至是html文件。所有这些类型均受igel支持。在后台,igel使用熊猫读取您的输入数据集并将其转换为数据框。

项目的点:

  • 从GUI使用
  • 支持大多数数据集类型(csv,txt,excel,json,html)
  • 支持所有最新的机器学习模型(甚至是预览模型)
  • 支持不同的数据预处理方法
  • 在编写配置时提供灵活性和数据控制
  • 支持交叉验证
  • 支持两种超参数搜索(版本> = 0.2.8)

支持yaml和json格式

支持不同的sklearn指标以进行回归,分类和聚类

支持多输出/多目标回归和分类

支持多处理并行模型构建

支持模型:
在这里插入图片描述
项目地址:

https://github.com/nidhaloff/igel


在这里插入图片描述

薅羊毛啦!七月在线【AI提升季】,【机器学习集训营】【推荐系统高级小班】【CV高级小班】【推荐系统入门】【深度学习入门】【机器学习入门】六大集训营、高级小班课程限时免听!
在这里插入图片描述
另外参与活动还可获得:机械键盘、SSD硬盘、七月VIP、AI经典纸质书等,100%有奖!
在这里插入图片描述
活动主会场:https://www.julyedu.com/active/assistance/AItisheng


项目二:zindi_wheat_growth — CGIAR小麦生长阶段挑战赛的第一名解决方案

问题是根据农民发送的图像估算小麦作物的生长阶段。模型必须获取图像,并以1(仅显示作物)到7(成熟作物)的比例输出显示的小麦生长阶段的预测。

数据集具有两组标签:不良和良好的质量,但是测试数据集仅由高质量的标签组成。首先,不良标签和良好标签之间没有明确的对应关系(良好标签仅包含5个类别:2、3、4、5、7)。



其次,使用简单的二进制分类器可以轻松地区分劣质图像。因此,它们来自不同的分布。查看这种模型的Grad-CAM可以发现,两组图像之间的主要区别在于这些白棒(极):
在这里插入图片描述
这就是训练过程包括两个步骤的原因:

  • 结合不良和优质标签对模型进行预训练
  • 仅在优质标签上微调模型

模型超参数:

  • 架构:ResNet101
  • 问题类型:分类
  • 损失:交叉熵
  • FC退出率:0.3
  • 输入大小:(256,256)
  • 预测的概率乘以类别标签并求和

数据增强:

  • 水平翻转
  • 随机亮度对比
  • ShiftScaleRotate
  • 模仿图像上的其他白棒(杆)
  • 标签扩展(以较低的可能性将类标签更改为邻居类)
  • 使用水平翻转作为TTA

训练过程

  • 预训练好和坏标签的混合,共10个时期
  • 微调优质标签,持续50个时期,降低高原学习率

系统环境:

  • OS: Ubuntu 16.04
  • Python: 3.6
  • CUDA: 10.1
  • cudnn: 7
  • pipenv

项目地址:

https://github.com/ybabakhin/zindi_wheat_growth

项目三:Vision-Transformer — Vision Transformer Tensorflow 2.0实现

尽管Transformer体系结构已成为自然语言处理任务的实际标准,但其在计算机视觉中的应用仍然受到限制。

在视觉上,注意力要么与卷积网络结合应用,要么用于替换卷积网络的某些组件,同时保持其整体结构不变。

我们表明,这种对CNN的依赖不是必需的,并且当直接应用于图像补丁序列时,纯转换器可以很好地执行图像分类任务。

当对大量数据进行预训练并传输到多个识别基准(ImageNet,CIFAR-100,VTAB等)时,与最先进的卷积网络相比,Vision Transformer可获得出色的结果,而所需的计算资源却大大减少训练。
在这里插入图片描述

项目地址:

https://github.com/kamalkraj/Vision-Transformer

项目四:tormentor — 用pytorch增强图像数据

在这里插入图片描述

设计原则

  • 简化扩充的定义
  • 每个扩充类的每个实例都是确定性的。
  • 输入和输出是pytorch张量,而pytorch在所有计算中都更可取。
  • 默认情况下,所有数据均为4D:[批处理x通道x宽度x高度]。
  • 单个样本扩充:批次大小必须始终为1。
  • 线程安全:每个扩充实例都必须是线程安全的。
  • 输入/输出仅限于一个或多个2D图像通道。
  • 增强要么保留通道,要么保留像素(空间)。
  • 增强类也将其工厂作为类方法
  • 限制对torch和kornia的依赖(至少对于核心软件包)。

项目地址:

https://github.com/anguelos/tormentor

帮助数千人成功上岸的《名企AI面试100题》书,电子版,限时免费送,评论区回复“100题”领取!没毛病

本书涵盖计算机语⾔基础、算法和⼤数据、机器学习、深度学习、应⽤⽅向 (CV、NLP、推荐 、⾦融风控)等五⼤章节,每⼀段代码、每⼀道题⽬的解析都经过了反复审查或review,但不排除可能仍有部分题⽬存在问题,如您发现,敬请通过官⽹/APP七月在线 - 国内领先的AI职业教育平台 (julyedu.com)对应的题⽬页⾯留⾔指出。

为了照顾⼤家去官⽹对应的题⽬页⾯参与讨论,故本⼿册各个章节的题⽬顺序和官⽹/APP题库内的题⽬展⽰顺序 保持⼀致。 只有100题,但实际笔试⾯试不⼀定局限于本100题,故更多烦请⼤家移步七⽉在线官⽹或 七⽉在线APP,上⾯还有近4000道名企AI笔试⾯试题等着⼤家,刷题愉快。
在这里插入图片描述


本文地址:https://www.6aiq.com/article/1630080897307
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出