现代化代码以提高性能,可扩展性和可移植性
使用英特尔高级矢量扩展512(英特尔AVX-512)指令,在最新的英特尔至强和英特尔酷睿处理器上编写可扩展并行性能的应用程序
借助下一代英特尔MPI库获得更大的可扩展性并减少延迟
向量化和线程化代码(使用OpenMP *)以利用最新的支持SIMD的硬件,包括英特尔AVX-512
通过使用适用于Python *的英特尔发行版和英特尔数据分析加速库(IntelDAAL)启用新的高性能Python *优化来加速机器学习
紧跟最新的标准和集成开发环境(IDE):
完整的C ++ 14和扩展的C ++ 2017
完整的Fortran 2008和部分Fortran 2018
Python 2.7和3.6
完整的OpenMP 4.5和初始OpenMP 5.0草案
Microsoft Visual Studio * 2017集成
灵活满足您的需求
在英特尔VTune放大器中体验更直观的新用户界面和增强的车顶线分析。在Platform Profiler的预览中运行更长的高级性能分析。
使用英特尔Advisor的Flow Graph Analyzer组件中的快速可视化原型环境可视化并行性。使用它可以交互式地构建,验证和可视化并行算法。
利用现已集成到英特尔Parallel Studio XE中的英特尔Python **加速数据分析和科学计算。
通过conda *,pip *,DockerHub *,APT GET和YUM访问最新的英特尔性能库和面向Python的英特尔发行版。
开始使用
请按照以下步骤开始使用Intel Inspector。
启动英特尔检查器
要启动:
-
英特尔Parallel Studio XE /英特尔Inspector独立GUI:运行 inspxe-gui命令或从“ Microsoft Windows * 所有应用程序”屏幕中,选择“ 英特尔Parallel Studio XE [版本] > 英特尔Inspector [版本]”。
-
英特尔System Studio /英特尔Inspector独立GUI:选择 工具 > 英特尔Inspector > 从IDE 启动英特尔Inspector。
-
Visual Studio * IDE的Intel Inspector插件:在Visual Studio * IDE中打开您的解决方案。
要启动命令行界面,请执行以下操作:运行 inspxe-cl命令。(要获得帮助,请在命令行后附加 -help。)
选择/创建项目
Intel Inspector基于项目范例,要求您创建或打开项目才能启用分析功能。
将分析项目视为:
-
编译的应用程序
-
可配置属性的集合,包括抑制规则和搜索目录
-
分析结果的容器
配置项目
数据集的大小和工作量直接影响应用程序的执行时间和分析速度。
为了获得最佳结果,请选择具有代表性的小型数据集,这些数据集创建的线程每个线程的工作量最少至中等。
您的目标:在尽可能短的运行时间中,执行尽可能多的路径和最大数量的任务(并行活动),同时将每个任务中的冗余计算量减少到最小,以保证良好的代码覆盖率。
运行几秒钟的数据集是理想的。创建其他数据集以确保检查所有代码。
配置分析
Intel Inspector提供了一系列预设内存和线程分析类型(以及自定义分析类型),可帮助您控制分析范围和成本。范围越窄,系统的负载越轻。范围越广,系统的负载越大。
小费:
迭代使用分析类型。首先从狭窄的范围开始,以验证您的应用程序是否正确设置并设定对分析持续时间的期望。仅当您需要更多答案并且可以忍受增加的成本时,才扩大范围。
运行分析
当您运行分析时,Intel Inspector:
-
执行您的应用程序。
-
确定可能需要处理的问题。
-
收集结果中的那些问题。
-
将符号信息转换为文件名和行号。
-
应用抑制规则。
-
执行重复消除。
-
形成问题集。
-
根据您的分析配置选项,可能会启动交互式调试会话。
选择问题
在分析过程中,Intel Inspector会按检测到的顺序显示问题。分析完成后,Intel Inspector:
-
将检测到的问题分组到问题集中(但仍可以查看单个问题和问题发生的位置)。
-
优先考虑问题集。
-
提供筛选以帮助您专注于需要注意的问题集。
日志:
英特尔软件很高兴地宣布推出英特尔Parallel Studio XE 2020更新1。此版本包括功能和安全更新,以及所有工具已更新为最新版本。
英特尔Parallel Studio XE 2020更新1-发行说明
-Intel Parallel Studio XE 2020更新1包括功能和安全更新。用户应更新到最新版本。
英特尔IMPI:
-在OFI / mlx提供程序中实现了动态流程支持
-添加了PMI2支持
英特尔数学内核库:
-ScaLAPACK引入了分布式非对称特征求解器功能
英特尔数据分析加速库:
-实施新算法:决策林的弹性网和概率分类
英特尔顾问:
-集成的Roofline功能预览添加了“第一瓶颈”可视化以及单个内核视图和指南
-Advisor Python API支持移至Python 3
英特尔VTune Profiler:
-以前代号为Icelake的英特尔处理器现在支持微体系结构探索分析。
此文件(Release_Notes.pdf)列出了所有新功能和更新的功能,以及此版本中可用的错误修复。